
オープンイノベーションのリーダーとして、私たちyet2は自らイノベーションを起こそうと努力しています。スカウト活動にビッグデータを活用することは、ここ数年、私たちが行ってきた投資です。初期の成果は期待外れでしたが、最近になって非常に興味深い結果が得られており、今後もその能力に磨きをかけていくつもりです。この無形概念をもう少し現実的なものにするために、私たちyet2がスカウティングでビッグデータをどのように活用しているか、3つの例を以下に紹介します:
ユニークで質の高いデータセットから始める:”ガベージ・イン、ガベージ・アウト “を避ける。
ビッグデータ戦略において最も重要なことは、高品質でユニークなデータセットにアクセスすることである。現在、多くの企業がアクセスしている標準的なイノベーションデータセット(臨床試験、特許、ベンチャーキャピタルからの資金調達、出版物など)は一握りです。yet2では、CMOデータベース、医薬品有効成分、化合物、そしてyet2独自のグローバルデータベースなど、新しいデータセットを構築しています。そして、最も重要なことは、異なる地域にまたがるユニークなトピックに特化したデータセットにアクセスする機能を構築することに、興味深い価値を見出していることです。例えば、中国の有望なCMOに関するデータセットをキュレーションし、消費者向けヘルスケアのクライアントの最近のプロジェクトで重要なスカウトソースとなりました。
ノイズの意味を理解する
データセットの中には他よりも質の高いものもあるが、不正確で不完全、最悪の場合、悪いデータで埋め尽くされているデータソースに出くわすこともある。そのようなリソースを拒否するのではなく、正規化、データ処理(例えば、一意の識別子を使用して異なるデータセットをマージし、より堅牢なデータセットを作成する)、スクリプトを使用して無関係なデータポイントを特定し削除するなど、前もってデータをクリーニングできることに興味深い価値を見出しています。yet2では、データセットの初期クリーニングを行いますが、これは反復的なプロセスであり、データが常に最新の状態に保たれるように繰り返すことを選択します。
データセットがきれいになったら、次にカスタムスクリプトを活用して膨大なデータセットをフィルタリングし、有望なリードを効率的に抽出します。これらのスクリプトは、yet2のチームがプロジェクト、データセット、トピック分野ごとにカスタムビルドしたものです。このステップにより、OIコンサルタントチームがデータセットを管理しやすくなり、10,000データポイントにも及ぶデータセットを数百の関連性の高いデータポイントに絞り込み、さらに人手によるレビューとフィルタリングを行います。
手を抜かない
初期データセットを入手したら、データからテクノロジー・ランドスケープをさらに理解するために、さまざまな分析ツールを適用します。データセットを分析し、技術クラスを特定するだけでなく、類似用語や同義語を特定し、追加的なスカウティングやフィルタリングを行います。
例えば、あるプロジェクトでは、有望な技術出版物の参考論文リストを分析し、検索対象の技術カテゴリーを追加抽出した。最初のソースでは、”低分子”、”味覚調節”、”植物性タンパク質 “といった用語が使われていました。20以上の参考論文リストに対してキーワード分析を実行した後、用語リストは「味覚知覚」、「抽出物」、「ペプチド」、「味覚増強剤」などの用語を含むように拡大しました。そして、データセットからさらに関連性の高いリードを抽出するために、これらをスクリプトにフィードバックする反復アプローチを採用している。
ビッグデータの活用に関する能力開発という点では、まだ表面しか見ていない。しかし、すでに我々のスカウティング・プロジェクト全体に価値が浸透しているのを目の当たりにしている。私たちは、懐疑的な立場から適格な信奉者へとシフトし、有望なテクノロジーをクライアントに提供し続けるために、この差別化能力を開発し続けることに興奮しています。
ビッグデータを活用した最近のプロジェクトをいくつかご紹介します:
ビッグデータについての詳細、または現在のプロジェクトについてのご相談は、お気軽にお問い合わせください。