🐪 ContentCleanerV0.2.pl (Perl) 12.4 KB 2007-01-14
Perl module for ContentCleanerV0.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# string::approx benutzen
# TheCerial: my $ApproxMatchingQuantifier = "40%";
# TheCerial: $matched = amatch($FileName, $ApproxMatchingQuantifier, $TemporarySearchQuery);
# my $sentences = get_sentences($text); # returns an array ref
# my $FullContentArray = &Main( $sentences );
# $WordCount = $#FullContent;
# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# reniceing to 20 !
# system ("renice 20 $$");
use strict;
use Text::German;
# use Text::English;
use Lingua::DE::ASCII;
# use Lingua::EN::Inflect;
... [truncated, 467 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.2.pl",
"description": "Perl module for ContentCleanerV0.2",
"dateModified": "2007-01-14",
"dateCreated": "2025-03-23",
"contentSize": "12.4 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.2.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentCleanerV0.3.pl (Perl) 18.0 KB 2007-01-14
Perl module for ContentCleanerV0.3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# string::approx benutzen
# TheCerial: my $ApproxMatchingQuantifier = "40%";
# TheCerial: $matched = amatch($FileName, $ApproxMatchingQuantifier, $TemporarySearchQuery);
# my $sentences = get_sentences($text); # returns an array ref
# my $FullContentArray = &Main( $sentences );
# $WordCount = $#FullContent;
# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# reniceing to 20 !
system("renice 20 $$");
system("clear");
use strict;
# use Text::German;
# use Text::English;
# use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
... [truncated, 657 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.3.pl",
"description": "Perl module for ContentCleanerV0.3",
"dateModified": "2007-01-14",
"dateCreated": "2025-03-23",
"contentSize": "18.0 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.3.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentCleanerV0.4.pl (Perl) 19.4 KB 2007-01-23
Perl module for ContentCleanerV0.4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# my $sentences = get_sentences($text); # returns an array ref
# my $FullContentArray = &Main( $sentences );
# $WordCount = $#FullContent;
# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# reniceing to 20 !
system("renice 20 $$");
system("clear");
use strict;
use Data::Dumper;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
use Lingua::DE::Sentence;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;
... [truncated, 710 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.4.pl",
"description": "Perl module for ContentCleanerV0.4",
"dateModified": "2007-01-23",
"dateCreated": "2025-03-23",
"contentSize": "19.4 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.4.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentCleanerV0.5.pl (Perl) 19.5 KB 2007-01-24
Perl module for ContentCleanerV0.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# my $sentences = get_sentences($text); # returns an array ref
# my $FullContentArray = &Main( $sentences );
# $WordCount = $#FullContent;
# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# reniceing to 20 !
system("renice 20 $$");
system("clear");
use strict;
use Data::Dumper;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
use Lingua::DE::Sentence;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;
... [truncated, 719 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.5.pl",
"description": "Perl module for ContentCleanerV0.5",
"dateModified": "2007-01-24",
"dateCreated": "2025-03-23",
"contentSize": "19.5 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.5.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentCleanerV0.6.pl (Perl) 27.8 KB 2007-01-24
Perl module for ContentCleanerV0.6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# my $sentences = get_sentences($text); # returns an array ref
# my $FullContentArray = &Main( $sentences );
# $WordCount = $#FullContent;
# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# perl -MCPAN -e 'install "Text::LevenshteinXS"'
# /usr/lib/perl5/site_perl/5.8.7/Lingua/DE/Wortschatz.pm
# reniceing to 20 !
# system("renice 20 $$");
# system("clear");
use strict;
use Data::Dumper;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Text::LevenshteinXS qw(distance);
use Lingua::EN::Inflect;
use Lingua::DE::Sentence;
... [truncated, 944 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.6.pl",
"description": "Perl module for ContentCleanerV0.6",
"dateModified": "2007-01-24",
"dateCreated": "2025-03-23",
"contentSize": "27.8 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.6.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentCleanerV0.7.pl (Perl) 28.2 KB 2007-01-24
Perl module for ContentCleanerV0.7
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo: wenn ein result von wortschatz kommt, dann erst prfen, ob der eintrag nicht schon vorhanden ist, erst dann hinzufgen !
### amazon content grabbing + adding
# my $sentences = get_sentences($text); # returns an array ref
# my $FullContentArray = &Main( $sentences );
# $WordCount = $#FullContent;
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# perl -MCPAN -e 'install "Text::LevenshteinXS"'
# /usr/lib/perl5/site_perl/5.8.7/Lingua/DE/Wortschatz.pm
# reniceing to 20 !
# system("renice 20 $$");
# system("clear");
use strict;
use Data::Dumper;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Text::LevenshteinXS qw(distance);
use Lingua::EN::Inflect;
use Lingua::DE::Sentence;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;
use Lingua::DE::TypoGenerator; # generate typing errors from given keyword
# random initilisation
srand();
... [truncated, 945 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.7.pl",
"description": "Perl module for ContentCleanerV0.7",
"dateModified": "2007-01-24",
"dateCreated": "2025-03-23",
"contentSize": "28.2 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.7.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentCleanerV0.8.pl (Perl) 33.2 KB 2007-01-27
Perl module for ContentCleanerV0.8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
# todo: wenn ein result von wortschatz kommt, dann erst prfen, ob der eintrag nicht schon vorhanden ist, erst dann hinzufgen !
### amazon content grabbing + adding
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# perl -MCPAN -e 'install "Text::LevenshteinXS"'
# /usr/lib/perl5/site_perl/5.8.7/Lingua/DE/Wortschatz.pm
# renicing to 20 !
system("renice 20 $$");
system("clear");
use strict;
use Data::Dumper;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Text::LevenshteinXS qw(distance);
use Lingua::EN::Inflect;
use Lingua::DE::Sentence;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;
use Lingua::DE::TypoGenerator; # generate typing errors from given keyword
# random initilisation
srand();
# array initialisierung
my @letters = ( "a", "b", "c", "d", "e", "f", "g", "h",
"i", "j", "k", "l", "m", "n", "o", "p",
... [truncated, 1073 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentCleanerV0.8.pl",
"description": "Perl module for ContentCleanerV0.8",
"dateModified": "2007-01-27",
"dateCreated": "2025-03-23",
"contentSize": "33.2 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.8.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentFilter.pl (Perl) 12.3 KB 2007-01-09
Perl module for ContentFilter
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
use strict;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;
use Data::Dumper;
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# englische funktionen:
### Number2Word(): wandele eine zahl in ein englisches wort um
### PluralManipulation(): bilde den plural von englischen wrtern
### StemmmingManipulation(): reduzierung von englischen wrtern auf ihre grundform
# deutsche funktionen:
### Zahl2Wort(): wandele eine zahl in ein deutsches wort um
### SynonymManipulation(): zuflliges ersetzen von deutschen wrtern mit einem zuflligem synonym zum ursprnglichen wort
### GrundformManipulation(): reduzierung von deutschen wrtern auf ihre grundform
# sprachunabhngige funktionen:
### TextBlowup(): fge satzkombinationen zum array hinzu -> nimm randomized einzelne wrter aus dem vorhandenen Text - sortiere dieses nach alphabetischer reihenfolge - und speichere das ergebnis ans (aktuell:Ende) des zu modifizierenden Textes
### StringManipulation(): buchstaben, zeichen, wrter spiegeln, vertauschen, lschen, ersetzen ...:
###
... [truncated, 502 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentFilter.pl",
"description": "Perl module for ContentFilter",
"dateModified": "2007-01-09",
"dateCreated": "2025-03-23",
"contentSize": "12.3 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentFilter.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
🐪 ContentFilterV0.1.pl (Perl) 12.3 KB 2007-01-09
Perl module for ContentFilterV0.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52 | #!/usr/bin/perl
#########################################
##### Author: Sebastian Enger / B.Sc
##### CopyRight: Sebastian Enger / B.Sc
##### LastModified 7.01.2007
##### Function: Dublicated Content Filter fr Google
##### Todo:
########################################
use strict;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;
use Data::Dumper;
# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result = Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
### amazon content grabbing + adding
# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# englische funktionen:
### Number2Word(): wandele eine zahl in ein englisches wort um
### PluralManipulation(): bilde den plural von englischen wrtern
### StemmmingManipulation(): reduzierung von englischen wrtern auf ihre grundform
# deutsche funktionen:
### Zahl2Wort(): wandele eine zahl in ein deutsches wort um
### SynonymManipulation(): zuflliges ersetzen von deutschen wrtern mit einem zuflligem synonym zum ursprnglichen wort
### GrundformManipulation(): reduzierung von deutschen wrtern auf ihre grundform
# sprachunabhngige funktionen:
### TextBlowup(): fge satzkombinationen zum array hinzu -> nimm randomized einzelne wrter aus dem vorhandenen Text - sortiere dieses nach alphabetischer reihenfolge - und speichere das ergebnis ans (aktuell:Ende) des zu modifizierenden Textes
### StringManipulation(): buchstaben, zeichen, wrter spiegeln, vertauschen, lschen, ersetzen ...:
###
... [truncated, 502 more lines] ...
|
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "ContentFilterV0.1.pl",
"description": "Perl module for ContentFilterV0.1",
"dateModified": "2007-01-09",
"dateCreated": "2025-03-23",
"contentSize": "12.3 KB",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentFilterV0.1.pl",
"encodingFormat": "text/x-perl",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Perl"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}
📄 readme.txt (Text) 51 bytes 2007-01-14
Project documentation file
{
"@context": "https://schema.org",
"@type": "SoftwareSourceCode",
"name": "readme.txt",
"description": "Project documentation file",
"dateModified": "2007-01-14",
"dateCreated": "2025-03-23",
"contentSize": "51 bytes",
"contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/readme.txt",
"encodingFormat": "text/plain",
"programmingLanguage": {
"@type": "ComputerLanguage",
"name": "Text"
},
"codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/"
}