Examensarbete:

Automatisk klassificering av handskrivna ordobjekt

Bakgrund

I vår programvara för automatisk datafångst görs i dagsläget endast helsidestolkning av de maskinskrivna orden på en digital dokumentsida, så kallad OCR. För att göra detta har vi två olika tolkmotorer att tillgå. Vi har även en tolk som klarar handskrift, men denna tolk jobbar bara på fältnivå, det vill säga tar som argument ett bildobjekt som innehåller något enstaka ord och ingenting annat. I framtiden skulle vi istället vilja göra en fullständig helsidestolkning, där alla ord oberoende av om de är handskrivna eller maskinskrivna tolkas.

Uppgift

Examensarbetet består av att hitta en metod för att automatiskt detektera vilka objekt på en sida som är handskrivna ord och vilka som är maskinskrivna. Till hjälp för att göra denna klassificering av handskrivna ord kan man till exempel använda sig av resultatet från vår ”bildobjektletare” (lista av rektanglar som innesluter bildobjekten). Vi har även en hel del klasser och metoder som kan vara till hjälp när man vill göra själva bildanalysen. Även OCR-resultatet kan vara av visst intresse.

Alternativt implementeras en helt och hållet egenutvecklad metod för detektion av handskrivna objekt. De objekt som detekteras som handskrivna kommer sedan att skickas vidare till vår handskriftstolk.

Utbildning

Civilingenjör D, Y, E eller motsvarande, alternativt matematisk utbildning med inriktning mot datavetenskap och numeriska metoder. Lämpliga förkunskaper: Goda teoretiska (och gärna praktiska) kunskaper inom relevanta områden som data- och bildanalys, numeriska metoder, programmering (gärna C++ och/eller C#). Antal studenter: 1-2.

Kontaktperson

Maria Rönnmark, 0733-378646
maria.ronnmark@readsoft.com

Ansökan

Till ansökan bifogas CV, personligt brev och betygsutdrag. Ansökan skickas till maria.ronnmark@readsoft.com.

Kontakta ReadSoft

Anna Ronnelin

Frågor är alltid välkomna. Hör av dig till oss så återkommer vi med informationen du behöver.

Anna Ronnelin
Personalchef
042-490 21 00