Technisches Konzept Geschätzte Lesezeit: 4 Minuten Bildergalerie Abbildung 1 Abbildung 2 Abbildung 3 Abbildung 4 Abbildung 5 Inhaltsübersicht: E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\... Als Online Tool ............................................... Anwendung ..................................................... Anglizismen.................................................... Paraphrasierungen ............................................. 8 E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Managemen... Bei OneTipp kann man einfach seinen geschriebenen Text reink... Grammatikalischen Satzumstellungen 3 Als Plugin in bestehender Schreib-/Dokumentensoftware Sekund... Mit Auslösen des KOnvertierungs-Buttons erhält man zu seinem... Grammatikalischen Satzumstellungen 8 Sprachzeichen - Umlaute richtig ausgeben 5.3 Paraphrasierungen Die Paraphrasierungen gehören in die kompl... Software Prototyp Aufbau einer Synonymdatenbank Aufbau ein... Massive Steigerung der Ergebnisqualität: gross geschriebene... Stopwordliste definieren: wenn Stopword aus Liste in den Syn... Wenn SynRank == 1 oder 0.86 dann nimm SYN Leipzig 4 Kyrillisch, Simple Chinese, Arabic) o https://pypi.python.or... Kurze Zusammenfassung: E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 1/9 Logo Technisches Konzept Texte leistungsschutzgerecht und rechtlich sicher verändern Dokumentname: Technisches-Konzept.docx Versionsnummer: 1.2.2 Erstellt am: 05.10.2015 Sang Tanzer Geprüft am: 15.10.2015 Sebastian Enger / Position Inhalt 1. Funktionalität ............................................................................................................................................. 2 2.1. Als Online Tool .................................................................................................................................. 2 2.2. Als Plugin in bestehender Schreib-/Dokumentensoftware ................................................................ Anwendung ................................................................................................................................................ 6 5.1. Tool .................................................................................................................................................... 6 5.4. Synonymen ........................................................................................................................................ 7 5.5. Anglizismen........................................................................................................................................ 7 5.6. Grammatikalischen Satzumstellungen .............................................................................................. 7 5.7. Akronymen ......................................................................................................................................... 7 5.8. Paraphrasierungen ............................................................................................................................ 8 6.2. Software Prototyp .............................................................................................................................. 8 E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 2/9 Logo 1. Funktionalität 2.1. Als Online Tool Primär wird die Nutzung in der Onlineumgebung realisiert. Bei OneTipp kann man einfach seinen geschriebenen Text reinkopieren 2. Mit Auslösen des Senden Buttons erhält man zu seinem geschriebenen Text alternative Textzusammenstellungen, die inhaltlich das gleiche Ergebnis erzielen, jedoch mit a. Paraphrasierungen b. Synonymen c. Akronymen d. Anglizismen e. Grammatikalischen Satzumstellungen 3. Diesen Text kann man anschließend in seinen Blog oder auf Social Media Kanälen verbreiten 4. Ausgegebene Texte sind Leistungsschutzkonform und verletzen keine Rechte möglicher Urheber mehr 2.2. Als Plugin in bestehender Schreib-/Dokumentensoftware Sekundär wird das leistungsfähige Tool als Plugin für Desktop- bzw. Das Plugin kann sowohl in Officeprogrammen online wie offline wie auch in mobilen Textbearbeitungsanwendungen eingesetzt werden. Die Funktionalität wird genau gleich sein, wie beim Onlinetool. Mit Auslösen des KOnvertierungs-Buttons erhält man zu seinem geschriebenen Text ebenso alternative Textzusammenstellungen, die inhaltlich das gleiche Ergebnis erzielen, jedoch mit a. Paraphrasierungen b. Anglizismen e. Grammatikalischen Satzumstellungen 8. E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 3/9 Logo 3. Oberfläche E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 4/9 Logo E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 5/9 Logo E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 6/9 Logo 4. Anwendung 5. Topics zu bearbeiten 5.1. Tool - Textzeichen am Anfang vom Original Text entfernen - Bei reinkopierten Absätzen sollten im Ergebnis auch einen Absatz einziehen (Schönheitskorrekturen sind erst zum Ende wichtig, zuerst Funktionalität) 5.2. Sprachzeichen - Umlaute richtig ausgeben 5.3. Rechtschreibung - Eigennamen sollten abgeprüft werden. https://de.wikipedia.org/wiki/Eigenname o Beispiel Ort: in Untergruppenbach, Neu Lübbenau o Beispiel Land: in Nordkorea, in Afghanistan am Hindukusch o Beispiel Fluss: an der oberen Donau o Beispiel Verein: der Verein Borussia Mönchengladbach o Beispiel Unternehmen: das Unternehmen Beiersdorf o Beispiel Institutionen: Universität Leipzig, Bernd-Blindow-Schule o Beispiel Produkte: Ferrero Rocher E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 7/9 Logo o Beispiel Tiernamen: der Tausendfüßler o Personennamen: Herr Winterkorn o Namenskombination: Martin Winterkorn (Abprüfen eines Vor- & Nachnamens) - Anmerkung SE: o Scanne aktuell (menschliche) Vor und Nachnamen -Aufbau einer eigenen Namensdatenbank: http://www.onomastik.com/ http://www.firstname.de/ http://www.namepedia.org/ http://www.beliebte-vornamen.de/ http://www.vornamenarchiv.de/ http://www.vorname.com/ - Eventuell hier Code hernehmen: o http://demo2-opener.rhcloud.com/welcome.action o http://www.opener-project.eu/project/demos/ - Priorisierung: 1. Vor und Nachnamen 2. Ort und Länder 5.4. Synonymen Aktuelle Quellen: 5.5. Anglizismen 5.6. Grammatikalischen Satzumstellungen - Abfrage der Zeitform - Präpositionalphrasen o Präposition + Nominalphrase: vor dem dunklen Stuhl, seit einer Stunde o Präposition + Adverb: seit damals, vor morgen 5.7. Akronymen E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 8/9 Logo TODO: Recherche, welche Webseiten eventuell nur Akronyme haben 5.8. Paraphrasierungen Die Paraphrasierungen gehören in die komplexere Strukturierung der Computer Linguistik. Ablauf 6.1. Informationssammlung Recherche welche Tools vorhanden sind Welche frei verfügbaren Informationsquellen können wir kostenlos anzapfen 6.2. Software Prototyp Aufbau einer Synonymdatenbank Aufbau einer Namensdatenbank Aufbau einer Akronymdatenbank o = freie Informationsquellen nutzen o Alles erledigen was erstmal geht, ohne einen Computerlinguisten Einbau der SYN, Namens, Akronym DB Kontinuierliches Testing von Sang und Basti Software Prototyp 1: o Funktionalität: 1. Erkennung von Vor und Nachnamen 2. Ersetzen von Synonymen und Akronymen 3. Massive Steigerung der Ergebnisqualität: gross geschriebene (Such)Worte nur mit gross geschrieben synonymen austauschen Datenbank verbessern - statt ein Startwort und dazu Synonyme ganz einfach Startwort+Synonyme in eine Tabelle schreiben und darüber mit Sphinx suchen lassen - dann beim Sphinx Suchen noch gute Filter mit einbauen Software Prototyp 2: o Stabiler, bugfreier Prototyp 1 mit Basisfunktionalität o Bereinigte Synonym- und Namensdatenbank (Keine Dubletten mehr) 1. QA auf die Namens und Synonym Datenbank o Sumy Textzusammenfassung einbauen o Austausch Synonyme nicht doppelt verwenden o SynRankCalculator: Berechne, wie gut ein Synonym passend ist 1. Später dann bei der Auswahl des Synonyms das mit dem verbleibenden höchsten Rang verwenden E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 9/9 Logo 3. Stopwordliste definieren: wenn Stopword aus Liste in den Synonymen vorkommt, dann gib ordentlich Minuspunkte (erstmal unwichtig) Software Prototyp 3: o Grundlegende API Call Design fertig stellen o Speed & Schönheitsfehler (Absätze fehlen) kümmern o Umlaute und Ausgabe von Schreibsonderlauten korrekt (kein String Ersetzen HACK) o ROCKSDB Datenbank als IN MEMORY Lösung (=Datenbank im Speicher halten für FAST ACCESS) - NamesDB als RocksDB im Hauptspeicher halten für schnelleren Zugriff o Web API (Wochenende: 17-18.10.2015) o Städtenamen, Monate, Flüsse etc als Datenbank mit aufnehmen (WO HERBEKOMMEN?) - WikiPedia klauen o Wortschartz Leipzig PythON: https://github.com/lehmannro/libleipzig-python einbauen : 1. Nutze zuerst Syn Leipzig 2. Berechne SynRank (=python) 3. Wenn SynRank == 1 oder 0.86 dann nimm SYN Leipzig 4. Wenn SynRank(von Leipzig) kleiner als 0.85 dann nimm lokale SYN MYSQL DB 6. Berechne SynRank von Lokale Mysql DB Wenn SynRank(Leipzig) grösser oder gleich SynRank(Mysql): Nimm Syn Leipzig (lemminized Version) Sonst: nimm Syn Mysql o Text Lesbarkeitsstatistiken: https://pypi.python.org/pypi/textstat/ o Ergebniscodierungen: Welche Elemente wurden wie geändert? Software Prototyp X: MUST HAVE: Transliteration (Übertragung von einem Sprachzeichensatz (zb. Kyrillisch, Simple Chinese, Arabic) o https://pypi.python.org/pypi/transliteration o https://pypi.python.org/pypi/transliterate o https://www.tablix.org/~avian/blog/archives/2009/01/unicode_transliteration_in_p ython/ o https://pypi.python.org/pypi/Unidecode Webschnittstelle: Definition Basics 1. Bildergalerie Abbildung 1 Abbildung 2 Abbildung 3 Abbildung 4 Abbildung 5 Auszug aus dem Inhalt: E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 1/9 Logo Technisches Konzept Texte leistungsschutzgerecht und rechtlich sicher verändern Dokumentname: Technisches-Konzept.docx Versionsnummer: 1.2.2 Erstellt am: 05.10.2015 Sang Tanzer Geprüft am: 15.10.2015 Sebastian Enger / Position Inhalt 1. 2 2.1. Als Online Tool .................................................................................................................................. 7 5.5. Anglizismen........................................................................................................................................ 7 5.6. Grammatikalischen Satzumstellungen .............................................................................................. 7 5.8. Paraphrasierungen ............................................................................................................................ 8 E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 2/9 Logo 1. Paraphrasierungen b. Anglizismen e. Grammatikalischen Satzumstellungen 3. Paraphrasierungen b. Anglizismen e. Grammatikalischen Satzumstellungen 8. E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 3/9 Logo 3. Oberfläche E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 4/9 Logo E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 5/9 Logo E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 6/9 Logo 4. Ort und Länder 5.4. Synonymen Aktuelle Quellen: 5.5. Anglizismen 5.6. Grammatikalischen Satzumstellungen - Abfrage der Zeitform - Präpositionalphrasen o Präposition + Nominalphrase: vor dem dunklen Stuhl, seit einer Stunde o Präposition + Adverb: seit damals, vor morgen 5.7. Akronymen E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 8/9 Logo TODO: Recherche, welche Webseiten eventuell nur Akronyme haben 5.8. Paraphrasierungen Die Paraphrasierungen gehören in die komplexere Strukturierung der Computer Linguistik. Ersetzen von Synonymen und Akronymen 3. Später dann bei der Auswahl des Synonyms das mit dem verbleibenden höchsten Rang verwenden E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisches-Konzept_v1.docx Seite 9/9 Logo 3. Wenn SynRank == 1 oder 0.86 dann nimm SYN Leipzig 4. Wenn SynRank(von Leipzig) kleiner als 0.85 dann nimm lokale SYN MYSQL DB 6. Berechne SynRank von Lokale Mysql DB Wenn SynRank(Leipzig) grösser oder gleich SynRank(Mysql): Nimm Syn Leipzig (lemminized Version) Sonst: nimm Syn Mysql o Text Lesbarkeitsstatistiken: https://pypi.python.org/pypi/textstat/ o Ergebniscodierungen: Welche Elemente wurden wie geändert? Bildbeschreibung: E:\Dropbox\S.Arbeit\02 CONSOLIDATED\02 Portfolio-Management\#_069 Sebastian Enger\#_69- 01_OneTipp\04_IT\01_Vorbereitung\Versionen\20151015_ONETIPP_Technisch... Datum der Veröffentlichung: 2025-05-02T22:39:58 Teile die Botschaft! Teile diesen Artikel in den sozialen Medien: Autor: