Technologia automatycznego generowania streszczeń i ekstrakcji informacji kluczowych dla dokumentów w j. polskim z wykorzystaniem metod uczenia maszynowego.
Przedmiotem projektu są prace B+R, których finalnym rezultatem będzie stworzenie technologii umożliwiającej ekstrakcję kluczowych informacji z tekstów j. polskiego; stanowi to uzupełnienie prac prowadzonych przez Wnioskodawcę w ramach projektu “Technologia kontekstowego rozumienia języka pisanego na potrzeby poprawy błędów oraz automatycznej oceny zrozumiałości tekstu”. Proponowane rozwiązanie bazuje na wykorzystaniu najnowszych metod uczenia maszynowego (w tym deep learning), z jednoczesnym uwzględnieniem zaawansowanej analizy językoznawczej (semantycznej), a także osiągnięć z obszaru przetwarzania języka naturalnego. Prace badawcze zostaną podzielone na dwa etapy. Celem etapu I będzie opracowanie modeli umożliwiających ekstrakcję z tekstów najistotniejszych zdań tak, by na ich podstawie możliwe było pełne zorientowanie się w sensie globalnym utworu. Rezultatem prac prowadzonych w ramach etapu II będzie natomiast opracowanie rozwiązań umożliwiających generowanie z tekstów NER-ów / słów kluczowych (w ujęciu biznesowym, tj. takich jak np. nazwa firmy, nazwa resortu/działu, NIP, REGON, przedmiot umowy itd.). Finalnym rezultatem tak prowadzonych prac B+R będzie jeden kompleksowy system (w postaci webowej oraz API) umożliwiający pełną analizę tekstów o różnej długości (w tym obszernych dokumentów). Rozwiązanie stanowić będzie odpowiedź na lukę rynkową (na podstawie analizy konkurencji Wnioskodawca stwierdził, że na rynku brak narzędzi o podobnych funkcjonalnościach) w zakresie narzędzia pomagającego uporać się z nadmiarem informacji. Numer_referencyjny_programu_pomocowego: SA.41471(2015/X) Przeznaczenie_pomocy_publicznej: art: 25 rozporządzenia KE nr 651/2014 z dnia 17 czerwca 2014 r. uznające niektóre rodzaje pomocy za zgodne z rynkiem wewnętrznym w stosowaniu art. 107 i 108 Traktatu (Dz. Urz. UE L 187/1 z 26.06.2014).
Your project description
To add a photo, description, specify a location or attach other materials about the project, you should fill out the form below. After clicking the “send” button, a message will be sent to you e-mail asking for confirmation. You must accept to submit the form. The EU Dot Map Guidelines and consent to the processing of personal data. materials will be sent to the editor of the site, who will publish it on the website after verification test.