スタートアップ企業のDefinedCrowdには、データサイエンティストが高品質のデータを収集、構造化、強化して人工知能アルゴリズムをトレーニングできるプラットフォームがあります。扱うデータの質と処理速度は、同社のビジネスの鍵です。Coltは、企業があらゆるデータに迅速かつ効率的にアクセスできるようにコネクティビティを提供しています。DefinedCrowdのITおよび情報セキュリティマネージャーであるRicardo Gusmãoは、Coltの国際的な存在を決定的な利点として強調しています。Coltはサプライヤーとしてだけでなく、成長段階にあるスタートアップを支援するパートナーでもあると考えています。
誰もが人工知能の可能性について話していますが、ほとんどの人はこのテクノロジーの背後にある原動力であるデータにあまり注意を払っていません。具体的には、AI アルゴリズムのトレーニングに欠かせないデータ品質です。DefinedCrowdはここにビジネスチャンスを見出し、非構造化トレーニングデータを構造化された高品質のデータセットに変換するための効率的なシステムを構築することを目標に、2015年に設立されました。DefinedCrowdは、Coltに委託した信頼性の高い高速接続を必要とする大量のクラウドデータを処理します。このサービスにより、機械学習モデルのトレーニングに必要なデータを収集、構造化、強化するスマートデータプラットフォームへのアクセスと管理が可能になります。
データのソースには 2 つの異なる起源があります。クライアントは DefinedCrowd にデータを提供して構造化することも、データの収集をリクエストすることもできます。データサイエンティストは、時間の 80% をデータの構造化に費やしていると推定されています。目標は、こうした面倒な作業から解放して、高性能な AI アルゴリズムの作成に集中できるようにすることです。
「クライアントはプラットフォームにアクセスして、必要なデータの種類をカスタマイズできます。たとえば、音声認識システムの開発に取り組んでいて、トレーニングデータが必要だとします。人に読んでもらいたいスクリプトの数、何回読んでもらいたいか、どの言語で読んでもらいたいかを決めます。その後、これらの要件はマイクロタスクに変換され、ヒューマンインザループコミュニティに送られます。」-DefinedCrowdのグローバルPR&コミュニケーションマネージャー、カタリーナ・サルテイロ氏
DefinedCrowdのコミュニティは同社サービスの重要な部分を占めており、70以上の言語と方言をカバーする13万人以上のユーザーがいます。ユーザーは画像にタグを付けたり、テキストを読んだり注釈を付けたり、クライアントのプロジェクトに貢献するその他の特定のマイクロタスクを実行したりします。これとエンジニアチームの専門知識により、同社は音声および自然言語処理技術において優れた業績を上げています。また、サービスを補完するために、コンピュータービジョンなどの他の機械学習エコシステムとも連携しています。
「私たちのコミュニティはマイクロタスクを実行してくれるので、質の高いデータセットを取得できます。現時点では、クライアントが必要とするデータを提供する有能なメンバーが揃っているため、品質の 95 ~ 98% を保証できます」と Salteiro 氏は言います。このデータインフラストラクチャ全体にアクセスするために、DefinedCrowdはColtのIPアクセスを対称的な1 Gbpsで使用しています。この接続により、同社のスマート・データ・プラットフォームと、処理対象となる全量のデータを管理します。生産性を最適化するには、データに高速でアクセスする必要がありますが、他にも決定的な要因があります。IT&情報セキュリティマネージャーのRicardo Gusmãoは、起こりうる攻撃からシステムを守るColtのウェブセキュリティサービスの重要性と、SLA条件や接続の信頼性を強調しています。
「アベイラビリティは非常に重要です。特に私たちのようにコミュニケーションに依存している企業ではそうです。この可用性と信頼性は最も重要な要素であり、Coltはそれを実現できます。」「Coltは単なるサプライヤーではなく、パートナーとして本当に思っています。」-IT&情報セキュリティマネージャー、リカルド・グスマン氏
DefinedCrowdには長くエキサイティングな道のりが待ち受けており、GusmãoはColtが成長過程を通じて役立つことができると確信しています。同社のスマートデータプラットフォームは多岐にわたるため、ヘルスケア分野のカスタマーケアから、自動車、エネルギー、フィンテック、小売、メディアに至るまで、さまざまな業界のクライアントと連携することができます。同社の製品は、企業が機械学習アプリケーションの品質とスケーラビリティを向上させ、市場への参入を加速できるよう支援することを目指しています。
DefinedCrowdのクライアントのほとんどは、BMW、マスターカード、ヤフージャパンなどの著名企業とともにフォーチュン500にランクされており、人工知能分野の新興企業と強固な関係があります。アマゾンは主要な投資家のひとつであり、アレクサの開発における彼らの役割に倣って、DefinedCrowdのサービスを推奨しています。同社はマイクロソフトの共同販売パートナーであり、同社のソリューションはIBMのWatsonプラットフォームにも統合されています。DefinedCrowdの急成長は、2018年夏に1180万米ドルの投資ラウンドを発表して以来、さらに加速しています。2019年には80人未満の従業員でスタートし、年末には150人で終わる予定です。現在、リスボン、ポルト、シアトル、東京にオフィスを構えています。Coltはこれらの都市で光ファイバー通信を行っており、世界中のすべての拠点で単一のプロバイダーを持つことも可能です。
DefinedCrowdは、将来の拡張をサポートするために、自社のサービスに使用するMicrosoft Azure専用のクラウドの可能性を検討しています。Gusmão 氏は次のように述べています。「情報へのアクセス速度は当社にとって極めて重要であるため、Colt が事業を展開している国々に拠点を置くことが非常に重要なのはこのためです」と Gusmão 氏は言います。「オフィスがある場所に拠点があると、人脈のやり取りの際にメリットがあります。」これらは、スタートアップ企業が自ら設定した目標の土台です。それは、人工知能イニシアチブのトレーニングデータサプライヤーとしてナンバーワンの企業になることです。











