La empresa emergente DefinedCrowd tiene una plataforma que permite a los científicos de datos recopilar, estructurar y enriquecer datos de alta calidad para entrenar algoritmos de inteligencia artificial. La calidad de los datos que maneja y la velocidad de procesamiento son clave para su negocio. Colt proporciona la conectividad de la empresa para que puedan acceder a todos sus datos de forma rápida y eficiente. Ricardo Gusmão, director de TI y seguridad de la información de DefinedCrowd, destaca la presencia internacional de Colt como una ventaja decisiva, y ve a Colt no solo como un proveedor sino también como un socio para ayudar a la empresa emergente en su fase de crecimiento.
Todo el mundo habla de las posibilidades de la inteligencia artificial, pero la mayoría presta menos atención a la fuerza impulsora de esta tecnología: los datos. En concreto, la calidad de los datos, que es fundamental para entrenar los algoritmos de IA. DefinedCrowd vio aquí una oportunidad de negocio y la empresa se fundó en 2015 con el objetivo de crear un sistema eficiente para convertir los datos de entrenamiento no estructurados en conjuntos de datos estructurados y de alta calidad. DefinedCrowd trabaja con grandes volúmenes de datos en la nube que requieren una conectividad fiable de alta velocidad, que confiaron a Colt. Este servicio le permite acceder y gestionar su plataforma de datos inteligentes, que recopila, estructura y enriquece los datos para entrenar modelos de aprendizaje automático.
La fuente de los datos puede tener dos orígenes diferentes. Los clientes pueden proporcionar los datos para que DefinedCrowd los estructure o pueden solicitar la recopilación de datos. Se estima que los científicos de datos dedican el 80% de su tiempo a estructurar los datos. El objetivo es liberarlos de esa ardua tarea para que puedan centrarse en crear algoritmos de inteligencia artificial de alto rendimiento.
«Los clientes van a la plataforma y pueden personalizar el tipo de datos que desean. Supongamos que están trabajando en un sistema de reconocimiento de voz y necesitan datos de entrenamiento. Deciden cuántos guiones quieren que lean las personas, cuántas veces quieren que lean y en qué idiomas. Posteriormente, estos requisitos se transforman en microtareas que se canalizan a nuestra comunidad de personas que están al día». - Catarina Salteiro, directora global de relaciones públicas y comunicación de DefinedCrowd
La comunidad de DefinedCrowd es una parte clave de la oferta de la empresa, con más de 130.000 usuarios que cubren más de 70 idiomas y dialectos. Los usuarios etiquetan imágenes, leen y anotan textos, además de realizar otras microtareas específicas que contribuyen a los proyectos de los clientes. Esto, junto con la experiencia de su equipo de ingenieros, permite a la empresa sobresalir en las tecnologías de procesamiento de voz y lenguaje natural. Para complementar sus servicios, también trabajan con otros ecosistemas de aprendizaje automático, como la visión artificial.
«Nuestra comunidad realiza las microtareas, lo que nos permite obtener conjuntos de datos de alta calidad. En este momento, contamos con miembros altamente cualificados para proporcionar los datos que nuestros clientes necesitan, lo que nos permite garantizar entre un 95 y un 98% de calidad», afirma Salteiro. Para acceder a toda esta infraestructura de datos, DefinedCrowd utiliza el acceso IP de Colt con 1 Gbps simétrico. Con esta conexión, gestiona su plataforma de datos inteligentes y todo el volumen de datos con el que trabaja. Para que la productividad sea óptima, se debe acceder a los datos a altas velocidades, pero otros factores también son decisivos. Ricardo Gusmão, director de TI y seguridad de la información, destaca la importancia del servicio de seguridad web de Colt, que protege su sistema contra posibles ataques, así como las condiciones del SLA y la fiabilidad de la conexión.
«La disponibilidad es muy importante, especialmente en empresas como la nuestra, que dependen de la comunicación. Esta disponibilidad, así como la fiabilidad, son los factores más importantes, y Colt es capaz de proporcionarlos». «Realmente veo a Colt como un socio, no solo como un proveedor». - Ricardo Gusmão, director de TI y seguridad de la información
DefinedCrowd tiene un largo y emocionante camino por delante, y Gusmão está convencido de que Colt puede serle útil durante todo su proceso de crecimiento. La transversalidad de su plataforma de datos inteligentes le permite trabajar con clientes de diferentes sectores, desde la atención al cliente en el sector sanitario hasta la automoción, la energía, la tecnología financiera, el comercio minorista y los medios de comunicación. Su producto se esfuerza por ayudar a las empresas a mejorar la calidad y la escalabilidad de sus aplicaciones de aprendizaje automático y acelerar su lanzamiento al mercado.
La mayoría de los clientes de DefinedCrowd figuran en la lista Fortune 500, con nombres destacados como BMW, MasterCard y Yahoo Japan, y tiene vínculos sólidos con empresas emergentes de inteligencia artificial. Amazon es uno de sus principales inversores y recomienda los servicios de DefinedCrowd por su papel en el desarrollo de Alexa. La empresa es un socio de ventas conjuntas de Microsoft y su solución también está integrada en la plataforma Watson de IBM. El rápido crecimiento de DefinedCrowd no ha hecho más que acelerarse aún más desde que en el verano de 2018 anunciara una ronda de inversión de 11,8 millones de dólares estadounidenses. Comenzó 2019 con menos de 80 empleados y planea terminar el año con 150. En la actualidad, tiene oficinas en Lisboa, Oporto, Seattle y Tokio. Colt tiene comunicación por fibra óptica en estas ciudades y ofrece la posibilidad de tener un único proveedor en todas sus ubicaciones del mundo.
Para respaldar su futura expansión, DefinedCrowd está considerando la posibilidad de una nube dedicada para Microsoft Azure, que utilizan para sus servicios. «Por eso es tan importante que Colt esté presente en los países en los que operamos, porque la velocidad de acceso a la información es muy importante para nosotros», afirma Gusmão. «Estar ubicados en lugares donde tenemos oficinas puede beneficiarnos a la hora de establecer conexiones». Estas son las bases del objetivo que se ha fijado la empresa emergente: ser el proveedor número uno de datos de formación para iniciativas de inteligencia artificial.











