研究に使う時間を最大化するためのクラウドソーシング活用――名古屋大学・東中教授の事例

研究に使う時間を最大化するためのクラウドソーシング活用――名古屋大学・東中教授の事例
スマートフォンやスピーカーに向かって話しかければ、その内容を機械が認識して返事をしたり音楽をかけたりしてくれる……このようなAI(人工知能)による対話処理の研究しているのが、名古屋大学 教授の東中竜一郎さん。今回、研究に用いるデータ作成においてLancers Outsourcingを活用していただきました。 大量のデータ作成作業をランサーズに依頼することで研究時間を確保できたという東中さん。AI研究におけるクラウドソーシングサービスの位置付けや、ランサーズを利用することになった経緯、そしてランサーズを上手に活用するためのポイントについて伺いました。

大量のデータを扱うAI研究では、クラウドソーシング活用が不可欠

東中さんは現在、どのような研究をされているのでしょうか?

人工知能の分野のひとつである、自然言語処理の研究を行なっています。その中でも、対話システムといって、人間の対話をコンピューターに扱わせるための研究が専門です。対話システムの研究によって、コンピューターに話しかけるだけで端末の操作を行うことができたり会話ができたりするようになるのです。例えばスマートフォンの音声操作やスマートスピーカーなどにこの技術が使われています。

私は、人間と会話できるコンピューターを開発することで、社会の役に立つものを作りたいと思って研究を進めています。この研究において重要なもののひとつが、コンピューターに人間らしい対話を覚えさせるための大量の対話データ。そのデータを分析し、統計処理を行うことでより自然な対話が可能となっていきます。

その研究にクラウドソーシングを利用された理由を教えてください。

データ作成には、当然時間もかかります。そのため、大量のデータを扱うAI業界においては、クラウドソーシングを利用してデータを作成するのが一般的なんです。私自身も前職の研究でクラウドソーシングを使っていましたので、今回もお願いすることにしました。

ランサーズに依頼された業務内容は、どのようなものだったのでしょうか?

複数人で会話しているミーティングの音声データを書き起こす、という業務です。長時間のミーティング音声を細かい発話区間に切り出して依頼。書き起こす際には、話者の特定やパラ言語情報(笑い声やノイズなど言葉以外の情報)の付加もお願いしました。

専属ディレクターの存在とコストパフォーマンスの高さが決め手

さまざまなクラウドソーシングサービスがある中で、ランサーズを選んだ理由を教えてください。

理由は大きく2つあります。ひとつは、作業をお願いするワーカーと依頼者である私との間で、ランサーズのディレクターの方が窓口になってくださるからです。

AI業界でよく利用されるクラウドソーシングサービスの場合、タスクの設定からワーカー管理、データ管理、問い合わせの対応まで、すべて依頼者が行うのが一般的です。加えて、誰でもできるような非常に簡単かつシンプルなタスクまで落とし込む必要があります。これらは手間や時間のかかる作業ですので、依頼する側にとって負担となります。

しかしランサーズの場合は、ディレクターの方がワーカーとのコミュニケーションや管理全般を担ってくれます。タスクのレベルに適したワーカーも選定してもらえるため、多少難易度の高いタスクをお願いすることもできます。このように、他のクラウドソーシングサービスでは依頼者側の負担となるものを、ディレクターの方に請け負ってもらえる点が魅力的でした。

もうひとつの理由は、価格がリーズナブルだったから。AIデータの作成は、専門業者に依頼すると費用が高額になってしまうことがあります。しかし今回は、専門業者でなくても対応可能と思われるタスクでした。かかる費用とタスクのレベル感を鑑みると、ランサーズがもっともコストパフォーマンスが高いと感じたため、今回お願いすることにしたのです。

ランサーズを利用したことで、求める成果を得ることはできましたか?

はい。クオリティもこちらが提示した仕様を満たしており、研究に有用なデータを得ることができました。ディレクターの方が窓口になってくださったおかげで、業務の進行もスムーズだったように感じます。データ作成やディレクションにかかる時間を、研究のために確保できたのが嬉しいですね。

今後、ランサーズへのご依頼の継続はお考えでしょうか?

今回依頼してみて、こちらの求めるクオリティの成果物を得られることが分かりましたので、今後、他の研究を行う際にもお願いしたいと考えています。対話システムの研究には、書き起こし作業が欠かせませんので。

適切なレベルのタスクを設定することで最大限のメリットを享受できる

今後の研究の展望をお聞かせください。

チャットボットなどのさまざまな対話システムのサービス化が進む中、AI研究において言語データ作成の重要度は今後ますます高まっていくでしょう。新たな研究をして世の中にないものを創るためには、多様なデータを取得して観察・分析しなければなりません。

私は対話システムの分野で、世の役に立つ新たな価値を創出したいのです。そのためにも、データ作成や分析をクラウドソーシングサービスにお願いしながら、研究のための時間を作っていきたいと考えています。

これからクラウドソーシングサービスを利用しようと考えている大学や企業に向けて、メッセージをお願いします。

クラウドソーシングサービスを有効活用するためには、タスクのレベル設定や切り分けがポイントだと感じます。例えばランサーズのワーカーの方々は一般に、特定の分野の専門知識があるわけではありません。そのため、マニュアル化して依頼できるようなタスクでなければ難しいでしょう。もし専門的かつ高度なタスクを依頼するのであれば、高額になったとしても専門業者に依頼することをお勧めしたいですね。

また大学の研究では、書き起こしデータの作成やアノテーション作業を学生にお願いする場合があると思います。学生が実際にデータを見ることや、手を動かしてデータを作ることは大切です。しかし、複数人の学生に依頼すれば、どうしても成果物の質にムラが出てしまう。その結果、確認や修正など手戻りが発生してしまいます。

統計処理の重要性が増す中、研究成果を出すためには大量のデータが必要となります。とはいえ、すべてを自分で作成するのは難しいのが実情です。それであれば、「研究に充てる時間を買う」というという考え方で、クラウドソーシングサービスの活用を選択肢のひとつにしてもいいのではないでしょうか。

===============================
▼LancersOutsourcingのサービス詳細やお問い合わせはこちら
https://www.lancers.jp/outsourcing
===============================

取材・文:矢野 由起
https://www.lancers.jp/profile/Yuki_s
SEOを意識したライティングを得意とし、Webライターとして活躍中。
大手旅行メディアでの記事執筆(企画/取材込み)やオウンドメディア、ビジネス系メディア(BtoB)での記事執筆を経験。