PFC

Extracció de tuples semàntiques / anotació de tuples

Work default illustration

Supervisor/s

Information

  • If you are interested in the proposal, please contact with the supervisors.

Description

Antecedents: En els últims anys, els mètodes de detecció d'objectes en imatges han experimentat una dramàtica millora: ara és possible predir amb un alt nivell de certesa la presencia de milers d'objectes diferents en imatges (podeu fer-vos-en una idea mirant la web Clarifai). Aquesta millora ha permès a la comunitat científica i a les grans empreses d'Internet com Google, Yahoo! o Facebook afrontar objectius més ambiciosos: generar automàticament descripcions textuals en llenguatge natural, és a dir, tal com ho faria una persona, per a fotografies disponibles en xarxes socials com Flickr o Instagram.

Objectius: En aquest projecte s'estudiarà com extreure "tuples d'arguments semàntics", una representació que conté els elements semàntics essencials d'una frase en llenguatge natural, de forma automàtica. Actualment es disposa d'una primera versió d'un software per a l'extracció de tuples d'arguments semàntics, i la tasca de l'estudiant serà intentar millorar els resultats obtinguts conjuntament amb el director de projecte.

Image and video hosting by TinyPic

Tècniques experimentals o metodologia que s'utilitzarà: Per a aquest projecte faran falta coneixements de Matlab i un bon nivell d'anglès. Coneixements previs de processament de llenguatge natural són un plus important, però s'espera que l'estudiant els adquireixi en el transcurs del projecte.

Breu pla de treball a realitzar: En una primera fase, l'estudiant es familiaritzarà amb el codi Matlab existent, i amb els conceptes de processament de llenguatge natural en general i els de tuples d'arguments semàntics en particular. En una segona fase, s'intentaran detectar els punts flacs del mètode actual, i millorar-los.