Consecución del hito 2 - PITCH

PITCH es el nombre que recibe el Prototipo Inteligente de análisis avanzado de grabaciones de voz para determinar la calidad, habilitar la identificación y facilitar el reconocimiento del comportamiento humano a través de técnicas de Inteligencia artificial.

Se trata de una herramienta tecnológica basada en el uso de técnicas de aprendizaje profundo que pretende extraer información de valor de grabaciones de voz aplicando tecnologías como el tratamiento masivo de datos, computación en la nube, biometría e inteligencia artificial.

Durante este segundo año se han continuado los trabajos de análisis y experimentación previstos en el anterior hito, con mayor dedicación a la categorización del contenido y la identificación biométrica de las personas participantes en una conversación.

A continuación se muestran los informes y tareas que se han desarrollado en esta segunda fase para alcanzar los objetivos finales del proyecto:

  1. Experimentación con el contenido de las grabaciones de voz: realización de una serie de experimentos para evaluar la mejor opción entre diferentes técnicas para la clasificación de textos, posibles dataset y soluciones ya implementadas por terceros con el objetivo de obtener un modelo que fuera capaz de diferenciar textos pertenecientes a distintas clases. Además se aplicó PLN para extraer de los textos entidades e información. El modelo seleccionado para la obtención de la representación del lenguaje en formato numérico así como para la posterior clasificación fue WordVectorizer + BiLSTM.
  2. Experimentación sobre la identificación biométrica: realización de múltiples experimentos con un dataset de más de un millón de audios y más de 7.000 hablantes. Se usó una red neuronal convolucional para generar el vector representativo del audio que se usaría posteriormente para identificar a las personas. Se logra una precisión del 81,6%.
  3. Prototipo para el análisis de contenido en las grabaciones de voz: prueba de concepto de un ejecutable que permite realizar análisis sobre el contenido existente en las grabaciones de voz, proporcionando un informe de resultados obtenidos de las capacidades funcionales logradas en base al informe científico para el análisis del contenido en las grabaciones de voz.
  4. Prototipo para la identificación biométrica en las grabaciones de voz: prueba de concepto de un ejecutable que realice análisis biométrico de la voz permitiendo la identificación unívoca de los interlocutores e incluso detectar el número de personas en las grabaciones de audio, y que pueda proporcionar un informe con los resultados obtenidos derivados del informe científico con la identificación biométrica en las grabaciones de voz.
  5. Prototipo Beta: prototipo final (fichero ejecutable) resultante de la integración de los distintos prototipos y algoritmia implementada en cada uno de los paquetes de trabajo. El prototipo es plenamente funcional para determinar la calidad de las grabaciones, analizar semánticamente las conversaciones, detectar sentimientos e identificar a los interlocutores. El prototipo está listo para su puesta en marcha y despliegue en entornos de pruebas dentro de laboratorios.
  6. Informe sobre la demostración y validación: con los resultados de las pruebas y tests realizados sobre el prototipo beta. Los objetivos son, por un lado, determinar la consecución de los cuatro ámbitos de las actividades desarrolladas en un laboratorio con ficheros de voz reales (análisis de calidad, contenido, sentimiento y biometría) y, por otro lado, demostrar la capacidad de ingestión y procesado de altos volúmenes de ficheros de entrada, así como del procesamiento de los resultados generados. El documento deberá contener la descripción lógica y técnica del prototipo y del entorno de laboratorio, el plan de pruebas ejecutado, detalle de los resultados obtenidos sobre una muestra representativa de ficheros de voz en cuanto al análisis de la calidad, del contenido, de sentimientos y de identificación biométrica. Conclusiones y oportunidades de mejora. Indicadores de capacidad de procesado, generación y clasificación de cantidades masivas de datos.
  7. Informe segunda anualidad y final: informe de gestión y control económico y técnico sobre la monitorización continua de los riesgos inherentes al proyecto PITCH.