欲しいデータが数十分で集まる? AI研究を圧倒的に加速させた京大教授のランサーズ活用術

欲しいデータが数十分で集まる? AI研究を圧倒的に加速させた京大教授のランサーズ活用術
京都大学大学院 情報学研究科に所属する鹿島さんは、主に機械学習と呼ばれるコンピュータ科学や人工知能の一分野を専門とする研究者(教授)です。機械学習や人工知能(AI)というと昨今巷(ちまた)でも話題に上る機会が多いですが、現場の研究では膨大かつ地道なテストデータが必要不可欠。 限られた研究予算のなか、どうやって低コスト&スピーディーに大量のデータを集めるのか。模索した結果、辿り着いたのがランサーズ(タスク方式)の活用でした。活用前に抱えていた課題、そして活用後に研究はどう変わったのか、詳しく聞いてみました!

ランサーズを活用する前に、どんな事業課題を抱えていましたか?

抱えていた課題は、「機械学習の研究で必要な大量のデータ集めに”時間もお金もかかっていた”こと」です。ご存知の方も多いとは思いますが、機械学習や人工知能(AI)の研究や開発には、多くの教師データが必要となります(教師あり学習の場合)。

しかし、ランサーズのようなクラウドソーシングサービスが登場する以前は、インターネットの力を使ってクラウド(群衆)に依頼する術がありませんでした。AI研究者は一人ひとりアルバイトさんを採用したり、研究室の学生に手伝ってもらうのが通例でした。

アルバイトさんを雇う場合は、対面でコミュニケーションを取りながら作業をしていただくのでデータの質は良くなります。でも、一人採用して作業に進んでもらうまでに「求人媒体の選定」→「求人の作成」→「面接」→「採用通知」→「作業内容の指示」と、とても時間がかかってしまうのです。

当時の私はアルバイト採用をまだしたことがなかったですが、スピード感がなく固定のコストがかかるアルバイト採用を進めるか迷っていました。研究の性質上、データの質にバラつきはあってもよかったので、もっとスピードとコストを圧縮できる方法を探していたのです。

Lancersでこう解決!

データ収集のスピードは以前の比較にならない

− ランサーズを使うことでデータの収集スピードはどう変わりましたか?
もう数字では表せられないほど飛躍的に上がりましたね。仮にアルバイトさんを採用していたケースと比較して考えても、圧倒的にデータ収集のスピードはアップしたと思います。

例えばですが、20件ほどのデータを集めたいとなった時、ランサーズのタスク方式で依頼を開始して、平均5〜15分ほどで20名のタスクワーカーさんの作業が完了します。大げさに言わず、これくらいのスピード感です。

− 確かに。アルバイトの採用を1人行なうだけでも早くとも数週間はかかりますもんね
はい。私たちの機械学習の研究では「画像の中から鳥の写真を選んでください」のような、一つひとつはとても簡単な作業をしていただいています。簡単だからこそ、アルバイトさんに決められた時間に集中して作業していただかなくても、ワーカーさんのちょっとしたスキマ時間の活用と相性がいいのです。

ランサーズが登場する以前では、インターネットを使って不特定多数の”今すぐ作業できます!”という方々に仕事を依頼するような方法がありませんでした。そのため我々のように、継続的な関係を通じて作業者の技能を向上させることが必ずしも重視されない業務では、わざわざアルバイトを新規採用する必要がなくなったと思います。

タスク方式は作業件数あたりの報酬発生。だから費用面の心配が少ない

− 作業スピードは上がったわけですが、一方で気になる費用面はどう変化しましたか?
ランサーズのタスク方式は、拘束時間あたりで報酬が発生する時給制のアルバイトとは違い、1件あたり●●円といったように作業件数あたりで報酬が発生し、最低1件5円からタスク(作業)を依頼することができます。

タスクワーカーさんは依頼内容や目安の工数から費用が見合うか判断して作業を開始しますので、費用は当然、作業内容に準じている必要があります。でも、作業していただいた件数に応じてしか金額は加算されていきませんので、依頼者側からすると、無駄なコストの発生を心配しなくて済むので安心して使えます。

− でも非対面での依頼となると、雑な作業もあったりしませんか?
最初は私も覚悟していました。ワーカーさんとは対面で一度もお会いしたことがありませんし、1件あたりの作業報酬は決して高くないですから。

でも、これは律儀で生真面目な日本人の性格ゆえでしょうか。想像以上にデータ入力やアンケート回答の質は高かったです。私たちの場合は、ある意味ノイズと言えるようなデータも求めていましたのでちょっと例外な依頼者だと思いますが、正確な作業を望んでいる一般的な依頼者でも十分に満足できることと思います。

今後の研究ビジョンについて

人とコンピューターの最適な協調を目指したい

− 鹿島さんの今後の研究ビジョンについて聞かせてください
最近、巷では「人工知能(AI)が働き方を大きく変える」「人間は人工知能(AI)に仕事を奪われる」など、いろいろな噂が飛び交っていますよね。確かに、私たちが研究している人工知能や機械学習といった技術は、未来の人間社会を飛躍的にアップデートすると思います。でも、人工知能(AI)も万能ではありません。得意な範囲は限られています。

そこで私は、いわゆる「ヒューマンコンピュテーション」と呼ばれる、人間と機械(ここでは機械学習や人工知能)が協調して、社会の複雑な問題を解いていけるような研究を進めていきたいと考えています。ヒトかAIか……と二者択一で捉えるのではなく、一方の不得意を一方の得意で補うような、そんな人とコンピューターの関係性を研究者としてつくっていきたいです。

− ありがとうございます。最後に、まだランサーズを使ったことがない研究者にメッセージをいただけますか?
素直に「一度試しに使ってみてはいかがですか?」と勧めたいですね。今や、私と同じ人工知能(AI)や機械学習分野の研究者はクラウドソーシングでデータ集めをするのが一般的になってきました。理系の研究者だけでなく、例えば心理学や社会学の研究でアンケートを集める際にも活用されていると耳にします。

アメリカのAI研究では、Amazonの「Mechanical Turk(メカニカルターク)」の活用が盛んですが、日本だとランサーズをはじめクラウドソーシングサービスが便利だと思います。「前例がないと許可が降りない」という大学や企業もあるかとは思いますが、Withコロナの2020年以降、そうは言ってられないのではないでしょうか。

取材・文:松内 稔樹
https://www.lancers.jp/profile/matsugorira
Web系企業でのマーケティング職を経て現在はフリーのWebマーケター・ライターとして活躍中。2020年度報酬ランキング・マーケター部門1位!(20年3月6日時点)