Technologievorrauschau OneTIPP Geschätzte Lesezeit: 2 Minuten Inhaltsübersicht: Technologievorrauschau OneTIPP Autor: SE / v1.2 / 16.2.2016 ... schein langfristig der wertvollere für uns zu sein (DEEP ode... WikiPedia Inhalte (http://dumps.wikimedia.org/dewiki/latest/... Einsatz von Software und Algorithmen i https://en.wikipedia.org/wiki/General_Architecture_for_Text_... http://aclweb.org/aclwiki/index.php?title=Word_sense_disambi... https://en.wikipedia.org/wiki/Information_extraction#Approac... https://github.com/recski/HunTag 3 http://taku910.github.io/crfpp/ 6 https://github.com/percyliang/sempre ii Natural Language Generation (Spracherstellung): i https://launchpad.net/nlgen2 ii Demo: sureal Lösungsansatz DEEP (Deep Learning Natural Langu... Quellcode: https://github.com/carpedm20/lstm-char-cnn-tensor... Quellcode: https://github.com/carpedm20/neural-summary-tenso... Kurze Zusammenfassung: Technologievorrauschau OneTIPP Autor: SE / v1.2 / 16.2.2016 Zielstellung: Time to Market verkürzen durch optimierten Technologieeinsatz SEMPRIA bietet interessante Technologie -aber: Abhängigkeit von Technologieanbieter o Aufbau eigener Technologie, angelehnt an Sempria Technologie - Aufbau v. Ausbau von Technologie basierend auf DEEP Learning (kurz: DEEP) These: Mit Lösungsansatz SEMP oder DEEP oder Kombination Beider kann die Funktionalität der Sempria GmbH und deren Umformulierungsdienst ganz oder teilweise abgebildet werden? Ansatz DEEP und/oder SEMP ist die Zukunftstechnologie von OneTIPP, sodass in Roadmap Phase B2B der 6 monatige Forschungsaufwand entfällt und die genannte Software nur noch für unsere Zwecke angepasst und trainiert werden muss - sprich wir direkt ein Produkt entwickeln können, ohne langwierigen Forschungsaufwand Hintergrund: o Autorenprofil muss natürlich erforscht werden. Ist es realistisch mit dieser (grün hervorgehobenen Algorithmen bzw. schein langfristig der wertvollere für uns zu sein (DEEP oder SEMP)? Bitte mit Zeitaufwand beim Einsatz von diesen fachlichen IT Experten: 1 bzw. Lösungsansatz SEMP (Natural Language Generation): 1. Aufbau eigene Datenbanken i. WikiPedia Inhalte (http://dumps.wikimedia.org/dewiki/latest/) ii. FreeBase Datenbank (https://www.freebase.com) iii. Roadmap) iv. Roadmap) v. Roadmap) vi. Statistische Daten: https://www.govdata.de/ | http://www.data.gov/ b. Einsatz von Software und Algorithmen i. Named Entity Recognition (Entity Extraktion: Eigennamen, Orte, Zeiten oder ähnliches herausgezogen und klassifiziert werden) iii. Folgende Open Source Software für Named Entity Recognition ist vorhanden: 1. https://en.wikipedia.org/wiki/General_Architecture_for_Text_Engineeri ng 2. https://en.wikipedia.org/wiki/OpenNLP c. Einsatz von Software und Algorithmen für Word sense disambiguation: i. http://aclweb.org/aclwiki/index.php?title=Word_sense_disambiguation_resour ces ii. https://en.wikipedia.org/wiki/SemEval iii. http://www.sfs.uni-tuebingen.de/GermaNet/ und Wrapper https://github.com/wroberts/pygermanet c. https://en.wikipedia.org/wiki/Information_extraction#Approaches) ii. Einsatz von Software und Algorithmen 1. https://github.com/mimno/Mallet 2. https://github.com/recski/HunTag 3. https://github.com/tpeng/python-crfsuite 4. https://wapiti.limsi.fr/ 5. http://taku910.github.io/crfpp/ 6. https://en.wikipedia.org/wiki/Conditional_random_field 3. Einsatz von Software und Algorithmen für Semantic Parsing: i. https://github.com/percyliang/sempre ii. https://github.com/opencog/link-grammar iii. https://github.com/opencog/opencog/tree/master/opencog/nlp/relex2logic d. Natural Language Generation (Spracherstellung): i. http://wiki.opencog.org/wikihome/index.php/Natural_language_generation e. Einsatz von Software und Algorithmen i. https://launchpad.net/nlgen2 ii. https://github.com/opencog/opencog/tree/master/opencog/nlp/sureal iii. https://github.com/opencog/opencog/tree/master/opencog/nlp 1. Demo: sureal Lösungsansatz DEEP (Deep Learning Natural Language Generation): Fragestellung: 1. Können wir Character-Aware Neural Language Models sinnvoll als DEEP Learning Ansatz für OneTIPP verwenden? Vgl: http://arxiv.org/abs/1508.06615 b. PDF: http://arxiv.org/pdf/1508.06615v4.pdf c. Quellcode: https://github.com/carpedm20/lstm-char-cnn-tensorflow 2. Können wir Neural Attention Model for Abstractive Sentence Summarization sinnvoll als DEEP Learning Ansatz für OneTIPP verwenden? Vgl: http://arxiv.org/abs/1509.00685 b. PDF: http://arxiv.org/pdf/1509.00685v2.pdf c. Quellcode: https://github.com/carpedm20/neural-summary-tensorflow 3. Können wir ein Sequence to Sequence als Deep Learning Modell erstellen, bei dem wir dem trainierten Seq2Seq Modell Parameter übergeben (z.B.: Ort, Person, Handlung, Organisation, Nomenphrasen etc) und unser Advanced Seq2Seq Modell dann sinnvolle Sätze erstellt, wobei die Parameter sinnvoll integriert werden Interessante Software: http://alias-i.com/lingpipe/ https://gate.ac.uk/ https://github.com/opencog/opencog Auszug aus dem Inhalt: Technologievorrauschau OneTIPP Autor: SE / v1.2 / 16.2.2016 Zielstellung: Time to Market verkürzen durch optimierten Technologieeinsatz SEMPRIA bietet interessante Technologie -aber: Abhängigkeit von Technologieanbieter o Aufbau eigener Technologie, angelehnt an Sempria Technologie - Aufbau v. Einsatz von Software und Algorithmen i. https://en.wikipedia.org/wiki/General_Architecture_for_Text_Engineeri ng 2. https://en.wikipedia.org/wiki/OpenNLP c. Einsatz von Software und Algorithmen für Word sense disambiguation: i. https://en.wikipedia.org/wiki/SemEval iii. https://en.wikipedia.org/wiki/Information_extraction#Approaches) ii. Einsatz von Software und Algorithmen 1. https://github.com/mimno/Mallet 2. https://github.com/recski/HunTag 3. https://en.wikipedia.org/wiki/Conditional_random_field 3. Einsatz von Software und Algorithmen für Semantic Parsing: i. https://github.com/percyliang/sempre ii. https://github.com/opencog/link-grammar iii. https://github.com/opencog/opencog/tree/master/opencog/nlp/relex2logic d. http://wiki.opencog.org/wikihome/index.php/Natural_language_generation e. Einsatz von Software und Algorithmen i. https://github.com/opencog/opencog/tree/master/opencog/nlp/sureal iii. https://github.com/opencog/opencog/tree/master/opencog/nlp 1. Quellcode: https://github.com/carpedm20/neural-summary-tensorflow 3. Können wir ein Sequence to Sequence als Deep Learning Modell erstellen, bei dem wir dem trainierten Seq2Seq Modell Parameter übergeben (z.B.: Ort, Person, Handlung, Organisation, Nomenphrasen etc) und unser Advanced Seq2Seq Modell dann sinnvolle Sätze erstellt, wobei die Parameter sinnvoll integriert werden Interessante Software: http://alias-i.com/lingpipe/ https://gate.ac.uk/ https://github.com/opencog/opencog Bildbeschreibung: Technologievorrauschau OneTIPP Autor: SE / v1.2 / 16.2.2016 Zielstellung: Time to Market verkürzen durch optimierten Technologieeinsatz SEMPRIA... Datum der Veröffentlichung: 2025-05-02T22:40:11 Teile die Botschaft! Teile diesen Artikel in den sozialen Medien: Autor: