エンジニアブログ 2023.10.31 FSS2023で発表した話と、過去の失敗がよぎった話 データ&リサーチグループ 望月です。 ファジイシステムシンポジウム2023(FSS2023)という学会が、2023/9/5~7に軽井沢(長野県)で開催されました。 そこで発表してきましたよ。 諸般の事情で、発表内容はここに書けないのですが。 論文アーカイブサイト「J-STAGE」で論文が公開されました。(2024/02/04) 内容に興味がある方は、以下を参照してください。 「分光カメラと深層学習を用いたブドウ農園でのべと病検出」 本記事では就活を控えた学生に向けて、印象に残った話を展開しますね。 「今回は静かに始まったわね。善きかな善きかな」 誰? 「私? ふふふ、『大宇宙の大いなる意思』と呼んでくれればそれでいいわ」 で、誰?(華麗にスルー) 「要はツッコミ役ね。話を進める仕掛けだと思って頂戴」 そんな雑にバラしていいのかキミ。 1. FSS2023の雰囲気 「で、学会発表はどうだったの? 難しい話は置いといて、雰囲気とか良かった点とか」 今回は会場が結婚式場だったので、雰囲気が華やかでした。 おかげでリラックスして発表を聞くことができましたね。すごくよかったです。 そういえばメイン会場以外は小さな部屋が多かったかな。チャペルで発表とか。 こういった非日常感はワクワクしますよね! 「雰囲気が柔らかいのはいいわね」 各会場の人数が少ないため、発表者との距離が近いのも好印象です。 現地で発表を聞くのなら、論文ではわからない、苦労話を聞きたいじゃないですか。 「どんな問題に直面して、どう乗り越えたか」という試行錯誤は、その人しか得られない貴重な知見だと思うんですよね。 せっかくライブで聴講するのなら、そこを知りたいと。 なので、質問しやすい雰囲気はありがたいです。大会場で挙手するのは、ハードルがね。 「好き放題書くから傍若無人マンだと思ってたけど、意外と小心者でした」 学会発表って、「専門の先生方が『素人質問で恐縮ですが』から全力でヘシ折りに来る」って都市伝説のイメージがありません? っていうか、あるのよ! アタシには! なので質問や発表する時は大層ビビってたのですが。 実際は会場の雰囲気もあって和やかに進行したので、発表する側にとってもありがたかったです。 あと「コーヒー飲み放題」ってのが高ポインツ! カフェイン大好きマンの望月にはたまりませんね! 「カフェインポイントはともかく、アナタは功徳ポイント積んだ方がいいわね」 功徳積んでますよ! この記事とか! 「...まぁ、言論の自由は憲法で保障されてるし」 で、みなさんの発表内容ですが、個人的には医療系AI活用の話を聞けたのがありがたかったです。 レントゲン・エコー・CT・MRIなどの医療系画像は、病気のデータが極端に少ないと。そこをどうするか。 機械学習は学習データが命なので、とにかく大量のデータが欲しいんですよね。 そのギャップには皆さん苦労されてました。 「病気が出ないに越したことはないし、予防もするから、健康データに比べれば病気データは少ないでしょうね。 病気が少ないこと自体はいいことなんだけど、AI技術者にとっては苦しいのね」 そうなんですよ。 望月が取り組んでいる農業系は、「データ取るチャンスは年に1回」ってパターンが多いです。 製造装置の異常検知だと、故障データが入手できるまで2~3年かかりますね。 異常データの少なさにはいつも泣かされてるので、みなさんの苦労話はわかりみが深いんですよ。 「なんとかならないの? みんな困ってるんでしょ?」 多くの方が試行錯誤してるけど、いい解決策は見つからない、って感じですね。 だから失敗談はワラワラ出てきます。 今回のBlog記事では、そんな望月の失敗談を述べますね。 2. 「学習データをAIで生成できないか」と考えて失敗した話 2.1. 前提 画像データから正常・異常を判断しよう、というのがその研究の狙いでした。これ自体はよくある話。 問題は、画像の解像度が低かったんですよね。それは制約があるので仕方ない。 解像度が低いと、正常と異常の区別がつきにくいです。両者の特徴の違いが見えにくいんですね。 だから推論の精度が上がらないと。さて、どうするか。 2.2. 対応案 「粗い解像度が問題なら、超解像技術などのAI技術で補完すればいいんじゃね?」 超解像技術とは、平たく言えば「粗い画像の細部を復元する技術」です。 SF映画(「ブレードランナー」とか)で、「画像を拡大するとドットがでかくなる(画像が粗くなる)」→「 細部を描画しなおしてクッキリハッキリ」ってシーンがありますよね。アレです。 これなら「粗い画像から細部を復元できる=正常データと異常データの差がわかりやすくなる=機械学習の精度が上がる」って寸法よ! 2.3. 結果 結論から言えば、うまくいかなかったわけですが。 超解像技術って、「粗い元画像に写っていない特徴を後から追加する」ってことです。 これは目的が「人が見て違和感がない画像を生成すること」なら、十分有効です。 例えば粗い顔画像に対し、別の高解像度の顔画像から取り出した細部の特徴(=高周波成分)を追加すれば、イイ感じの高解像度画像を生成できますね。 いや本当に凄いっスよ。SF世界がやってきたヤァヤァヤァ!って感じで、衝撃的でした。 「そんなにテンション上がるってことは、なかなかよさそうじゃない」 ところがどっこい! 目的が「機械学習向け学習データ生成」となると、話が変わります。 加工後のデータで学習すると、機械学習モデルは「本来のデータになかった特徴」を学習してしまいます。 そんな別物の特徴を学習したモデルが正常・異常を判断できるかというと、難しいですね。 まとめるとこんな感じ。 ・ 目的:なぜそれをするのか (Why) 「異常検知できるケースを増やすことで、より多くの人の作業を楽にする」 ・ 目標:何を達成するのか (What) 「コストやノイズが厳しい現場から得た、粗い画像で異常検知する」 ・ 手段:どうやって達成するのか (How) 「超解像技術でデータの細部を復元する」 ・ 問題:目的を達成できない (Problem) 「復元した細部の情報が、本来の正常・異常の特徴と合致しない可能性あり」 3. 「目的」さえ明確なら、なんとでもなります そろそろ締めに入ります。 何かをやるときは、目的を明確にすることが大切です。経験がないことを始めるときは特に。 経験上、作業が行き詰るときは「目的を見失ってた」ってケースが多い気がします。 「うまく行かない手段に固執してた」って感じかな。 上の例なら、「超解像技術で何とかする」という手段が目的になってしまった、と。 「仕事でもハマりやすいトラップね...。 『上からの指示をこなす』という手段が目的にすり替わって、ゴール見失って大炎上とか」 そうして人は疑うことを覚えるのですよ...。 行き詰った時は、目的に立ち返って見直すとよいです。 手段が目的と合わなくなったら、目的に合う、別の手段を考えればいいだけ。 上の例で言うと、正攻法なら「元画像の解像度を上げる」ですね。 あるいは、データの水増し(回転・反転等)で学習データを増やして、学習を数で押し切るとか。 目的を達成するやり方はいろいろあります。 そして目的さえ明確なら、多少回り道しても辿り着けます。必ず。そこを目指しているのだから。 でも哀しいかな、行き詰っているときって、そのように俯瞰する余裕がないんですよね。 そして失敗して初めて、「手段に固執しすぎてた」と悟るわけです。はぅ。 それでも一度経験すれば、今後は俯瞰して見る意識がつくでしょう。失敗は貴重な経験なのですよ! というわけで、アヴァシスは失敗を経験した人たちを大歓迎します! カモナジョイナス! (注:「Come on to join us!」というメッセージです) この記事を書いた人 「データ&リサーチグループ」改め「先端技術研究グループ」の望月です。 ゲーム好きが高じてコンピューターとソフトに興味を持ち、そのままソフト屋さんになりました。 マネージャーという名の課長職に(また)なりましたが、単身で学会発表してきます。 そんなフリーダムな職制でいいのか。(自問)