yshr10ic’s Blog

備忘録

ABEJA主催のSIX 2019に参加してきました

SIX 2019

株式会社ABEJAが主催する社会実装に関するAIの最新事例、活用技術に関するカンファレンス、SIX 2019に参加してきました。 備忘録を兼ねて、僕が参加したセッションについてメモしていきます。(箇条書きレベルですみません・・・)

six.abejainc.com

f:id:yshr10ic:20190305225511j:plain
ABEJA SIX 2019

本記事について

SIX 2019は2 Daysカンファレンス(1日目がディベロッパー向け、2日目がビジネスマン向け)ですが、諸事情により1日目のみ参加しました。参加したセッションは以下です。

  • 技 特別講演(講演者:株式会社ABEJA 緒方 貴紀 氏)

  • 食事画像認識モデル開発プロジェクトでの10 5個の教訓(講演者:株式会社FiNC Technologies 南野 充則 氏)

  • アノテーションで精度の高い教師データを作成するために必要な仕組み(講演者:株式会社ABEJA 寺本 拓磨 氏)

  • 徹底討論 : AI導入・運用を加速せよ、40分一本勝負!(講演者:マスクド・アナライズ 氏、株式会社ABEJA 岡田 陽介 氏、Still Day One 合同会社 小島 英揮 氏)

SIX 2019に参加した理由

  • ABEJA Platformという言葉を聞いたことがあるが、ABEJAについてよく知らなかったので、これを機に知っておきたかった

  • 最近画像のアノテーションを実施する機会があったのですが、うまくいかないことも多く、アノテーションで有名な?ABEJAさんが、どのようなツールでどのようにアノテーションを実施しているのか知りたかった

  • 参加費無料だったから、行きやすかった・・・

  • マスクド・アナライズ氏ってどんな人なのかちょっと気になっていた・・・

技 特別講演(講演者:株式会社ABEJA 緒方 貴紀 氏)

  • ABEJAのサービスの紹介

    • ABEJA PLATFORM
    • ABEJA INSIGHT for Retail
    • ABEJA PLATFORM Annotation
  • ABEJAのサービスの振り返り

    • 各サービスが2018年度、どれだけ使用されたか
    • 各サービスでどのような機能を追加したか
  • ABEJAのこれから

    • ABEJA PLATFORM Accelerator(MLaaS)
      • ユーザが学習に必要な画像などをアップロードすると、あらかじめ用意されたモデルで学習できる。使用できるモデルは順次増えていく予定。

abejainc.com

食事画像認識モデル開発プロジェクトでの10 5個の教訓(講演者:株式会社FiNC Technologies 南野 充則 氏)

  • 研究開発の目的

    • 栄養素・カロリーを画像からできるだけ精緻に推定すること
  • 研究開発で行ったこと

    • カロリー推定のアプローチ方法検討
      • 画像から何を推定するのか(レシピ or 栄養素 or 食材)
    • データセットの作成
      • レシピ&カロリーデータベースの作成
      • 評価用食事データセットの作成 → FiNCオフィスにて2000のレシピのデータセットを作ったとのこと!
      • 食事レシピ認識モデル用データセットの作成
    • モデルの作成
      • 食事レシピ認識モデルの作成
  • 5つの教訓

    • プロジェクトはアジャイルで進めるべき
      • DLは精度の評価が難しい
      • 大部分はブラックボックス(一定の理論はあるけども・・・)
      • 特に使用したことのないモデルを使用する場合は見積もりが難しい
    • 評価方法の決定から始める
      • 目的が曖昧になる、人によって解釈が異なる
      • 無駄に時間を過ごしてしまう
    • オペレーションは自社で構築
      • モデルよりもデータセットが大事
      • 質を保てるオペレーション
      • オペレーション構築はPoCフェーズでする。構築完了後に、拡大していく(他社を使っても良い)
    • PDCAの速度を最速にする
      • モデル作成がゴールではない
      • モデル公開後の精度を上げていくプロセスまで設計することが大事
      • 一番コストがかかるのはデータの収集~アノテーション
    • DL/ML人材はソフトウェア人材から輩出させるべき
      • 前処理の対応力
      • 幅広い知識
      • ソフトウェアエンジニアがDLできるようなカリキュラム作成が大事
      • 非常に優秀なDLエンジニアの獲得と、サーバサイドエンジニアの底上げ

アノテーションで精度の高い教師データを作成するために必要な仕組み(講演者:株式会社ABEJA 寺本 拓磨 氏)

  • ABEJAが提供しているアノテーションサービス
    • Annotation Tool(β版)
    • 委託サービス
  • アノテーションの要件定義
    • 答えが重なるラベル(チャーハンとピラフの分類など)
      • アノテーターによって傾向がぶれる
    • 解決策
      • 詳細なルール決め
      • ラベルの間引き(迷ったら、Aにラベル付けするなど)
    • 熟練工データセット
      • 特徴
        • 画像から分かりにくい
        • 様々な種類の画像がある
        • 傷の程度などによるレベル分け
      • 解決策
        • 画像補正、前処理(モデル化)
        • 境界線定義
        • チェックフロー
  • アノテーターの分析
  • 学習済みモデルを使ったアプローチ
    • 事前推論
      • 事前推論モデルの精度が高いと、モデルを信頼しすぎてしまい、適当にやってしまう
      • デコイを混ぜておく
    • 自動領域抽出
    • 能動学習

徹底討論 : AI導入・運用を加速せよ、40分一本勝負!(講演者:マスクド・アナライズ 氏、株式会社ABEJA 岡田 陽介 氏、Still Day One 合同会社 小島 英揮 氏)

  • 有名AIベンチャーにAI開発を頼むときに、予算1億円は妥当か
    • NVIDIAGPUサーバで3,000万
    • データサイエンティスト、AIエンジニアで1,500万/年×2年で3,000万
  • DGWA(出川)サイクル
    • Do:まずは試してみる
    • Go for Broke:「当たって砕けろ」の試行錯誤を繰り返す
    • Warm Mind:周囲の理解や失敗を許容する暖かい環境づくり
    • Re"A"ction:社内で反応・反響を起こしつつ「ありがとう」を忘れない

所感

  • 画像認識、アノテーションを中心に講演を聞きましたが、どこでも悩むことは同じだと感じました。いかにアノテーションを効率的に正確に実施するか、は各社で試行錯誤しているのかと。
  • ABEJAさんのAnnotation Toolで事前推論や能動学習など(すでに実装されている?)の機能が非常に便利そうなので、案件があれば使ってみたいなと思いました。
  • どこの企業さんでもPoCから先に進めるのを苦労している印象でした。DL/MLはお金はかかるけど結果はやってみないと分からないという難しい分野ではあると思うので、そこをどうお客さんに説明していくかが重要だと感じました。