Dr.drokubo「助手ブローリン君!」
助手ブローリン「…一体どうしちゃったんですか?」
Dr.「え?」
助「いや、みんなの声を代弁してみました」
Dr.「いやそのあれじゃ、まだ著者自身方向性が定まっていないのじゃから、勘弁してほしいのじゃ」
助「その『…じゃ』は続けるんですか?」
Dr.「いや?」
助「(会話形式にする理由はいくつか考えられる…ボケのツッコミ役がいて楽、短かいコンテンツもだらだらやって長く見せられる、対立する両論併記しとけば炎上を避けられる…
それに今回は内容が薄い、というか内容がないののごまかし…たぶん全部だな)」
Dr.「何か言ったか?」
助「いえ。Dr.、それより今回のお題ですが、『ML4WS』って何ですか?」
Dr.「助手君、キミはエーアイとは何か知っているかね?」
助「ああ、確か解剖しなくてもCTとれば殺人の証拠が見つかるやつ」
Dr.「お前はどこのチームバチスタだ。それはAiで、Autopsy imagingな。てかお前がボケたらそれぞれの役割がボケるだろうが。全部大文字でAIだ!」
助「安室奈美恵 featuring」
Dr.「もうええわ!ありがとうございました!」
助「それで終わったら怒られますよね…。Artificial Intelligenceつまり人工知能ですね。最近も、崩壊したりいろいろバズッってるやつ」
Dr.「そうだ。流行の波はセキュリティ業界にも押しよせ、今やセキュリティもAIなんだ!」
助「といっても、AI=機械学習のコンテキストですけどね」
Dr.「その通り。MLとはMachine Learningつまり機械学習のことじゃ。しかしこの機械学習というやつは厄介な諸刃の剣での、攻撃側にも防御側にも使えるという。そのことが、今回のAI流行の前、2011年にそれを指摘した論文があっての」
助「↓ですか」
Dr.「最悪の敵か最良の友…か。善悪はそれを用いる心の中にあり…」
助「科学者がよく使う詭弁じゃ!って、サクラ先生!?ひょっとして、それが言いたかっただけ?」
Dr.「(無視して)で、ここからが本題じゃ。ML4WSとは、Machine Learning for Web Securityのこと。つまりさっきのでいうと、ワーストエネミーでなくベストフレンドの方じゃ。もう、だいじょうぶ心配ない…」
助「(無視して)しかし、最近セキュリティ界だと、MLに対する攻撃(adversarial example)とか、ML応用でもマルウェア検知が流行りじゃないですか?」
Dr.「そこはあれだ、そんなみんなやってることをやっても、面白くないじゃろ!」
助「(きっと大人の事情だな…)」
Dr.「マルウェアに比べ、ないない言ってるが、結構あるぞ。ML4WS。学習のターゲットもさまざま。ざっと以下に挙げてみよう。」
- maliciousなWebサイトの検出
- maliciousなクローラの検出
- Web脆弱性の予測
- 脆弱性テストの学習
- WAF、フィルタリングの学習
- Webアプリケーションに対する攻撃の予測
助「ちょっと待ってください。maliciousなクローラって何すか?クローラにmaliciousかそうでないか、なんてあるんですか?ていうか、判断できるんですか?]
Dr.「じゃ、これからいくか。」
助「patient?患者?」
Dr.「そうこれ、医療情報学ジャーナルなんだよね。分野違いのせいか、機械学習やクローラについて丁寧に説明しているのが好印象。ただ、内容は医療向けというより、一般にも通用する内容だな…
で、さっきの質問だけど、後でmaliciousなことをするための予備調査として動くのがmaliciousなクローラということらしい。ふるまいとして、クローラとそうでないものを、次の5つの観点で区別しているぞ」
- 既知クローラのIPアドレス
- 既知クローラのuser agent
- Robots.txtへのリクエスト
- HEADメソッドによるリクエスト
- 画像リクエストなし&referer値なし
Dr.「上の条件に合致しなければ、クローラというわけだ。それをSVMで学習させているよ」
助「ふーん。でもまあなんかふつーですよね。この論文の新しい点は?」
Dr.「きびしいこと言うな。従来の特徴量に加えて、次の2つを加えたことらしい。それで精度がちょっと上がったらしいぞ」
- セッション中有効なリクエストの数
- 固有の(繰り返しリクエストされない)ページ数
助「なるほどー」
Dr.「気持ちこもってないなー。まあクローラ検出はこの論文が引用している通り、先行研究もあるぞ。
じゃ次いこかー。と、言いたいところだけど、それは、CMの後でーす」
助「上戸彩か!え?終わり?」
Dr.「はい。長くなりすぎたんで、この辺で切っときましょ」
助「長くなったのは脱線が多すぎるせいでは…」
Dr.「そういうなサノスよ。
誰かの文章を読んで「何を言いたいのかわからない」という感想を言ってくる人は「文章は何か言いたいことがあるから書くものだ」という思い込みを持っているのだろうね。「この文章の主題はなにか」「作者は何を言いたかったのか」式の試験問題に解答し続けてきた人たちの読み方なのかな。
小田嶋隆氏Twitter
と、小田嶋先生もおっしゃっておる!」
助「(小田嶋先生というか、伊集院光の悪影響だな)」
Dr.「まあ、これで終わるのもあんまりなので、次回予告をば。
次回は、maliciousなWebサイトの検出の話を。これは、↓の論文を読んでおくとよいぞよ」
助「S&Pの論文ね。なんか、うっすいうっすいスープを飲まされたあげく、おかわりは来週まで待てとか…はぁー」