Eerste aanzet tot project metatagging en spraaktechnologie

Vorige maand is op initiatief van Anita Cremers en Ronald van Buren (beiden TNO en Hogeschool Utrecht) een workshop georganiseerd om de mogelijkheden en kansen rond spraaktechnologie en metatagging van multimedia content te bespreken. Tijdens deze bijeenkomst is met een groep bedrijven, consultants en omroepen gesproken over de ontwikkelingen op dit terrein.

Aanbieders van de bekende softwarepakketten werden door de aanwezigen ervaren als kostbaar, beperkt flexibel en gericht op de Engelse taal. Het gebruik van spraaktechnologie kent veel toepassingen. Ondermeer is gesproken over:

  • het ondertitelen van materiaal of het maken van een transscriptie,
  • het zoeken in videocontent naar bepaalde uitspraken,
  • het indexeren van highlights zodat in grote hoeveelheid content kan worden gezocht naar specifiek materiaal,
  • spreker herkenning (bv: in welke journaals sprak Balkenende)

In de praktijk blijkt het bronmateriaal vaak cruciaal voor de kwaliteit die behaald kan worden in ‘herkenning’. Dit heeft ook te maken met het gebruik van jargon, of er muziek (of ander achtergrondgeluid) doorheen gespeeld wordt, of er in dialect wordt gesproken, of er mensen door elkaar spreken en of er ondersteunende informatie beschikbaar is (bijvoorbeeld de autocue van het journaal).

De toepassing stelt vervolgens de kwaliteitseis aan de ‘herkenning’. Voor het genereren van een transscript moet een hoog slagingspercentage worden behaald. Als het gaat om een aantal cruciale tags uit het materiaal te ontlenen (het woord kredietcrises valt 10x) dan is een veel lager slagingspercentage al voldoende.

In de discussie is uiteindelijk gefocust op een project zogenaamd RAAK-Light project waarin twee demonstratie-applicaties worden opgeleverd met een eenvoudige webinterface en een op metadata-gebaseerde zoekinterface. Hierin wordt een diversiteit aan domeinen en gebruikers belicht. In deze applicaties wordt onderscheid gemaakt tussen zoeken in snel (bv. al tijdens een uitzending) gegeneerde metadata van relatief lage kwaliteit en langzamer (bv. na een uitzending) gegenereerde metadata van relatief hoge kwaliteit.

Toepassingen zijn onder andere:

  • Publieke TV content zoals nieuws en achtergronden vanaf uitzendinggemist.nl. Ontsluiting in dit domein is een groot probleem en heeft ook een grote doelgroep. Met deze demo laten we zien welke mogelijkheden er zijn.
  • Educatie – onderwijs en training content beschikbaar enerzijds vanuit opleidingen en anderzijds uit specifieke trainingen voor ondernemingen. Ontsluiting in dit domein is relatief nieuw, terwijl veel content is geproduceerd voor eenmalig gebruik en daarmee zeer dure content is.
  • Door publiek gegenereerde content (à la: www.zeeburgtv.nl). Deze content is van sterk variërende kwaliteit en samenstelling, bv. uitspraakvarianten van het Nederlands en achtergrondgeluiden. Een zoekmechanisme gebaseerd op metadata van beperkte kwaliteit heeft hier toch al veel toegevoegde waarde.

Het project gaat waarschijnlijk vanaf januari lopen en wordt geleid door de Hogeschool Utrecht. Bedrijven die niet bij de workshop in september aanwezig waren en wel aangesloten willen blijven op de voortgang en hierop ook input willen leveren kunnen een berichtje sturen naar Arno Bouwens.

16-10-2008 |

Participanten

  • ECP
  • kvk
  • provincie noord holland
  • media academie
  • gemeente almere
  • gemeente hilversum
  • GfK
  • rabobank
  • media park
  • syntens
  • RTL Nederland
  • Villa Heideheuvel
  • united broadcast facilities
  • publieke omroep
  • gemeente amersfoort
  • hogeschool utrecht
  • inholland
  • TNO
  • gemeente haarlem
  • Beeld en Geluid