• エンジニアブログ

2023.10.31

FSS2023で発表した話と、過去の失敗がよぎった話

データ&リサーチグループ 望月です。

ファジイシステムシンポジウム2023(FSS2023)という学会が、2023/9/5~7に軽井沢(長野県)で開催されました。
そこで発表してきましたよ。

諸般の事情で、発表内容はここに書けないのですが。
論文アーカイブサイト「J-STAGE」で論文が公開されました。(2024/02/04)
内容に興味がある方は、以下を参照してください。
「分光カメラと深層学習を用いたブドウ農園でのべと病検出」

本記事では就活を控えた学生に向けて、印象に残った話を展開しますね。


「今回は静かに始まったわね。善きかな善きかな」

誰?

「私? ふふふ、『大宇宙の大いなる意思』と呼んでくれればそれでいいわ」

で、誰?(華麗にスルー)

「要はツッコミ役ね。話を進める仕掛けだと思って頂戴」

そんな雑にバラしていいのかキミ。


1. FSS2023の雰囲気

「で、学会発表はどうだったの?
 難しい話は置いといて、雰囲気とか良かった点とか」

今回は会場が結婚式場だったので、雰囲気が華やかでした。
おかげでリラックスして発表を聞くことができましたね。すごくよかったです。
そういえばメイン会場以外は小さな部屋が多かったかな。チャペルで発表とか。
こういった非日常感はワクワクしますよね!

「雰囲気が柔らかいのはいいわね」

各会場の人数が少ないため、発表者との距離が近いのも好印象です。
現地で発表を聞くのなら、論文ではわからない、苦労話を聞きたいじゃないですか。
「どんな問題に直面して、どう乗り越えたか」という試行錯誤は、その人しか得られない貴重な知見だと思うんですよね。
せっかくライブで聴講するのなら、そこを知りたいと。
なので、質問しやすい雰囲気はありがたいです。大会場で挙手するのは、ハードルがね。

「好き放題書くから傍若無人マンだと思ってたけど、意外と小心者でした」

学会発表って、「専門の先生方が『素人質問で恐縮ですが』から全力でヘシ折りに来る」って都市伝説のイメージがありません?
っていうか、あるのよ! アタシには!
なので質問や発表する時は大層ビビってたのですが。
実際は会場の雰囲気もあって和やかに進行したので、発表する側にとってもありがたかったです。

あと「コーヒー飲み放題」ってのが高ポインツ!
カフェイン大好きマンの望月にはたまりませんね!

「カフェインポイントはともかく、アナタは功徳ポイント積んだ方がいいわね」

功徳積んでますよ! この記事とか!

「...まぁ、言論の自由は憲法で保障されてるし」

で、みなさんの発表内容ですが、個人的には医療系AI活用の話を聞けたのがありがたかったです。
レントゲン・エコー・CT・MRIなどの医療系画像は、病気のデータが極端に少ないと。そこをどうするか。
機械学習は学習データが命なので、とにかく大量のデータが欲しいんですよね。
そのギャップには皆さん苦労されてました。

「病気が出ないに越したことはないし、予防もするから、健康データに比べれば病気データは少ないでしょうね。
 病気が少ないこと自体はいいことなんだけど、AI技術者にとっては苦しいのね」

そうなんですよ。
望月が取り組んでいる農業系は、「データ取るチャンスは年に1回」ってパターンが多いです。
製造装置の異常検知だと、故障データが入手できるまで2~3年かかりますね。
異常データの少なさにはいつも泣かされてるので、みなさんの苦労話はわかりみが深いんですよ。

「なんとかならないの? みんな困ってるんでしょ?」

多くの方が試行錯誤してるけど、いい解決策は見つからない、って感じですね。
だから失敗談はワラワラ出てきます。
今回のBlog記事では、そんな望月の失敗談を述べますね。


2. 「学習データをAIで生成できないか」と考えて失敗した話

2.1. 前提

画像データから正常・異常を判断しよう、というのがその研究の狙いでした。これ自体はよくある話。
問題は、画像の解像度が低かったんですよね。それは制約があるので仕方ない。
解像度が低いと、正常と異常の区別がつきにくいです。両者の特徴の違いが見えにくいんですね。
だから推論の精度が上がらないと。さて、どうするか。

2.2. 対応案

「粗い解像度が問題なら、超解像技術などのAI技術で補完すればいいんじゃね?」

超解像技術とは、平たく言えば「粗い画像の細部を復元する技術」です。
SF映画(「ブレードランナー」とか)で、「画像を拡大するとドットがでかくなる(画像が粗くなる)」→「 細部を描画しなおしてクッキリハッキリ」ってシーンがありますよね。アレです。
これなら「粗い画像から細部を復元できる=正常データと異常データの差がわかりやすくなる=機械学習の精度が上がる」って寸法よ!

2.3. 結果

結論から言えば、うまくいかなかったわけですが。

超解像技術って、「粗い元画像に写っていない特徴を後から追加する」ってことです。
これは目的が「人が見て違和感がない画像を生成すること」なら、十分有効です。
例えば粗い顔画像に対し、別の高解像度の顔画像から取り出した細部の特徴(=高周波成分)を追加すれば、イイ感じの高解像度画像を生成できますね。
いや本当に凄いっスよ。SF世界がやってきたヤァヤァヤァ!って感じで、衝撃的でした。

「そんなにテンション上がるってことは、なかなかよさそうじゃない」

ところがどっこい!
目的が「機械学習向け学習データ生成」となると、話が変わります。
加工後のデータで学習すると、機械学習モデルは「本来のデータになかった特徴」を学習してしまいます。
そんな別物の特徴を学習したモデルが正常・異常を判断できるかというと、難しいですね。
まとめるとこんな感じ。

・ 目的:なぜそれをするのか (Why)
  「異常検知できるケースを増やすことで、より多くの人の作業を楽にする」
・ 目標:何を達成するのか (What)
  「コストやノイズが厳しい現場から得た、粗い画像で異常検知する」
・ 手段:どうやって達成するのか (How)
  「超解像技術でデータの細部を復元する」
・ 問題:目的を達成できない (Problem)
  「復元した細部の情報が、本来の正常・異常の特徴と合致しない可能性あり」


3. 「目的」さえ明確なら、なんとでもなります

そろそろ締めに入ります。
何かをやるときは、目的を明確にすることが大切です。経験がないことを始めるときは特に。

経験上、作業が行き詰るときは「目的を見失ってた」ってケースが多い気がします。
「うまく行かない手段に固執してた」って感じかな。
上の例なら、「超解像技術で何とかする」という手段が目的になってしまった、と。

「仕事でもハマりやすいトラップね...。
 『上からの指示をこなす』という手段が目的にすり替わって、ゴール見失って大炎上とか」

そうして人は疑うことを覚えるのですよ...。

行き詰った時は、目的に立ち返って見直すとよいです。
手段が目的と合わなくなったら、目的に合う、別の手段を考えればいいだけ。
上の例で言うと、正攻法なら「元画像の解像度を上げる」ですね。
あるいは、データの水増し(回転・反転等)で学習データを増やして、学習を数で押し切るとか。
目的を達成するやり方はいろいろあります。
そして目的さえ明確なら、多少回り道しても辿り着けます。必ず。そこを目指しているのだから。

でも哀しいかな、行き詰っているときって、そのように俯瞰する余裕がないんですよね。
そして失敗して初めて、「手段に固執しすぎてた」と悟るわけです。はぅ。
それでも一度経験すれば、今後は俯瞰して見る意識がつくでしょう。失敗は貴重な経験なのですよ!

というわけで、アヴァシスは失敗を経験した人たちを大歓迎します! カモナジョイナス!
(注:「Come on to join us!」というメッセージです)