最近,某大企業の下請けをしている会社から共同研究の話があった.ぶっちゃけ飲み会の席なので,どこまで具体化するかわからないけど,もし実現したら先ずは試験的に分析をしてみたい.

ここの会社はかなりの部外秘データを持っている.具体的な業務は,センサから取得したデータを用いて技術的な分析を行うのだが(詳しくは言えませんが・・・),技術者の経験と勘が必要でかなりのコストがかかる.そのため,センサの数が限られてしまうが,それだと分析が十分ではなく見落としも起こる.

理想的にはセンサ数を増やして細かく分析することだが,それにはデータが膨大になりすぎて限られた社員では対応しきれない.そこで,人間より多少粗っぽい分析になってもいいので,人工知能で代用できないかという話だった.

これは,データ分析や機械学習をある程度やったことのある私にとってはまさに福音.普通,こういうデータは部外秘なので入手することは非常に困難.だけど,もし研究できるのであれば,いくらでも研究ネタを作れる宝の山.正直そのままにしておくのはもったいない.

 

機械学習を生かすには?

数年前くらいから「ビッグデータ」が注目を集めている.かつては「データマイニング」などと言われたこともあったが,まぁ似たようなものだ.データマイニングは分析技術に着目した言い方で,ビッグデータは分析対象に着目した言い方.どちらも機械学習や統計を使う.

個人的には流行り言葉は嫌いなのであまり使いたくないのだが(笑),必ずしも「ビッグ」でなくても,それぞれの企業には部外秘のデータは保有しているはずであり,それらを有効活用できる可能性は十分ある.

そのためのツールとして大変強力なものが機械学習であり,一昔前と違って専門知識がなくても容易に利用できるようになった.

だけど,簡単に使えるようになったと言っても,統計や多変量解析などの数理的知識と,生の実データを実際に扱った経験がないと,実用となるとなかなか難しいのも確か.人工知能だからと言って野放しに任せて上手くいくような単純な話ではない

ツールにデータを渡すまでには様々な前処理や整形も必要だし,データの渡し方も重要だ.客観的な評価を得るためにはいろいろ考慮すべき点も多く,しかもそれらはデータの性質に大きく依存する.きちんと手綱を持ってツールを利用しないと,信頼のある結果は得られない.

 

結局は研究も人付き合いがキーポイント

機械学習そのものは現在でも研究が活発であるが,応用面ではまだ十分に活用されていないような気がする.応用に際して最も重要なのは分析対象となる実データ.そのような部外秘のデータは世の中至る所にあるはずだが,持ってる側は宝の持ち腐れ,分析する側は簡単には入手できず,というお互いにマイナスな状況にある.大企業であれば自前でそれ専門の人を育てる(あるいは採用する)余裕もあるが,中小だとそうもいかない.

私は分析する側の人間だが,こういうデータを持っている中小企業とどれだけ信頼関係を結べるのかが結局のところ一番重要になると思う.研究者も社交的にならないといけない時代になってきてます.実を言うと私はあまり得意ではないけどね(笑)

とにかく,今回の話はもし試験的な分析でうまくいったら,それを足がかりにNEDOとかJSTのような政府系の大型競争的資金の獲得を狙ってみます(内容的に獲得できる自信あり).こちらの労力で研究するわけだから,相手側の負担はほとんどゼロ.金銭的負担も外部資金で獲得すればよいから,相手にとってもメリットが大きい.こういうwin winな関係に持っていきたいなと思ってます.

あまり書きすぎると身バレしちゃうので,この辺でやめておきます(笑)

 

http://sosui.sakura.ne.jp/wp/wp-content/uploads/2017/08/girl-2181709_640.jpghttp://sosui.sakura.ne.jp/wp/wp-content/uploads/2017/08/girl-2181709_640-300x225.jpgsosui_yoshi三流研究者の日常(雑記)共同研究最近,某大企業の下請けをしている会社から共同研究の話があった.ぶっちゃけ飲み会の席なので,どこまで具体化するかわからないけど,もし実現したら先ずは試験的に分析をしてみたい. ここの会社はかなりの部外秘データを持っている.具体的な業務は,センサから取得したデータを用いて技術的な分析を行うのだが(詳しくは言えませんが・・・),技術者の経験と勘が必要でかなりのコストがかかる.そのため,センサの数が限られてしまうが,それだと分析が十分ではなく見落としも起こる. 理想的にはセンサ数を増やして細かく分析することだが,それにはデータが膨大になりすぎて限られた社員では対応しきれない.そこで,人間より多少粗っぽい分析になってもいいので,人工知能で代用できないかという話だった. これは,データ分析や機械学習をある程度やったことのある私にとってはまさに福音.普通,こういうデータは部外秘なので入手することは非常に困難.だけど,もし研究できるのであれば,いくらでも研究ネタを作れる宝の山.正直そのままにしておくのはもったいない.   機械学習を生かすには? 数年前くらいから「ビッグデータ」が注目を集めている.かつては「データマイニング」などと言われたこともあったが,まぁ似たようなものだ.データマイニングは分析技術に着目した言い方で,ビッグデータは分析対象に着目した言い方.どちらも機械学習や統計を使う. 個人的には流行り言葉は嫌いなのであまり使いたくないのだが(笑),必ずしも「ビッグ」でなくても,それぞれの企業には部外秘のデータは保有しているはずであり,それらを有効活用できる可能性は十分ある. そのためのツールとして大変強力なものが機械学習であり,一昔前と違って専門知識がなくても容易に利用できるようになった. だけど,簡単に使えるようになったと言っても,統計や多変量解析などの数理的知識と,生の実データを実際に扱った経験がないと,実用となるとなかなか難しいのも確か.人工知能だからと言って野放しに任せて上手くいくような単純な話ではない. ツールにデータを渡すまでには様々な前処理や整形も必要だし,データの渡し方も重要だ.客観的な評価を得るためにはいろいろ考慮すべき点も多く,しかもそれらはデータの性質に大きく依存する.きちんと手綱を持ってツールを利用しないと,信頼のある結果は得られない.   結局は研究も人付き合いがキーポイント 機械学習そのものは現在でも研究が活発であるが,応用面ではまだ十分に活用されていないような気がする.応用に際して最も重要なのは分析対象となる実データ.そのような部外秘のデータは世の中至る所にあるはずだが,持ってる側は宝の持ち腐れ,分析する側は簡単には入手できず,というお互いにマイナスな状況にある.大企業であれば自前でそれ専門の人を育てる(あるいは採用する)余裕もあるが,中小だとそうもいかない. 私は分析する側の人間だが,こういうデータを持っている中小企業とどれだけ信頼関係を結べるのかが結局のところ一番重要になると思う.研究者も社交的にならないといけない時代になってきてます.実を言うと私はあまり得意ではないけどね(笑) とにかく,今回の話はもし試験的な分析でうまくいったら,それを足がかりにNEDOとかJSTのような政府系の大型競争的資金の獲得を狙ってみます(内容的に獲得できる自信あり).こちらの労力で研究するわけだから,相手側の負担はほとんどゼロ.金銭的負担も外部資金で獲得すればよいから,相手にとってもメリットが大きい.こういうwin winな関係に持っていきたいなと思ってます. あまり書きすぎると身バレしちゃうので,この辺でやめておきます(笑)  アラフォー三流研究者の日常とGEEKな世界