Pollner Péter - Hierarchikus struktúrák kinyerése statisztikus alapon

A modern számítástechnikai eszközök hétköznapi használatával egyre több lehetőség adódik az emberi viselkedésről, emberek véleményéről nagy mennyiségben adatot gyűjteni. A nagy tömegű adatgyűjtésnek azonban megvannak a nehézségei is: az adatok rendszerezéséhez, átláthatóvá tételéhez új megközelítések, automatizálható eljárások szükségesek.

Az ELTE TTK Regionális Tudásközpont révén elnyert TÁMOP pályázat keretében olyan eljárások fejlesztésén dolgozunk, amelyek segítik az eligazodást az előre nem rendszerezett adatokban. Az előadásban olyan eljárást ismertetek, amely adatok együttelőfordulási statisztikái alapján ad támpontokat a tájékozódáshoz.

Olyan rendszereket vizsgáltunk, amelyekben az egyes objektumokat rövid leírásokkal, azaz címkékkel jellemzik. Ha a címkéknek van már egy előre definiált struktúrája, akkor ez kimutathatóan megjelenik az együtt-előfordulási statisztikáikban. De a fordított út is számos esetben járható: a címkék előfordulási gyakoriságai alapján felépíthető egy hierarchikus struktúra, amelyben az egymáshoz kapcsolódó általános érvényű és speciális jellegű elemek alá- és fölérendelési relációkba sorolhatók.

2013.10.17. 15:00