Project over metadata genereren uit content op basis van spraaktechnologie

Logo iMMovatorIn samenwerking met TNO ICT en de Hogeschool Utrecht wil iMMovator een project starten voor MKB-bedrijven in de mediasector die kansen zien bij de toepassing van spraaktechnologie op het genereren van metadata uit multimediale content. Hierdoor kan metadata automatisch worden gegenereerd.

Het archiveren van multimediale data is dankzij digitale opslagtechniek sterk vereenvoudigd. Het toekennen van betekenisvolle metadata om bijvoorbeeld snel de content te kunnen vinden die over een bepaald onderwerp handelt of door bepaalde personen wordt behandeld, is nog altijd tijdrovend mensenwerk. Als de multimedia een geluidkanaal bevat, waarin ook spraak voorkomt, is het mogelijk om met spraaktechnologie (automatische herkenning van spraak, sprekers, taal, etc.) een grote hoeveelheid metadata automatisch te genereren.

TNO heeft deze spraaktechnologie in huis. In samenwerking met de Hogeschool Utrecht kunnen we laten zien wat er mogelijk is op het gebied van automatische metadata-generatie. Als uitvoerders worden gevorderde studenten, minimaal derdejaars in nauwe samenwerking met TNO onderzoekers ingezet. De gegenereerde metadata wordt toegankelijk en doorzoekbaar gemaakt via een eenvoudige webinterface. Een eerste eenvoudig voorbeeld is hier te vinden, waar je op trefwoord kunt zoeken in het Radio-1 Journaal. Het resultaat is een demonstratieapplicatie in de vorm van enkele metadata-gebaseerde zoekinterfaces.

Het project kost je alleen je tijd, de inzet van TNO en de HU wordt gefinancierd uit zogenaamde RAAK-gelden. Er is een beperkt aantal plaatsen beschikbaar, dus als je kansen ziet voor jouw bedrijf, en je voldoet aan de MKB-norm, stuur dan meteen een email naar Arno.Bouwens@immovator.nl. We bevestigen je deelname bij ontvangst.

Binnenkort zullen we een afspraak plannen waarbij alle geïnteresseerden bij elkaar komen om de project outline en deliverables gezamenlijk te bespreken.