🐪 ContentCleanerV0.2.pl (Perl)

12.4 KB 2007-01-14

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.2

#!/usr/bin/perl 

#########################################
##### Author:		Sebastian Enger / B.Sc
##### CopyRight:	Sebastian Enger / B.Sc
##### LastModified	7.01.2007
##### Function:		Dublicated Content Filter fr Google
##### Todo:			
########################################

# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result	= Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
###	amazon content grabbing + adding

# string::approx benutzen 
# TheCerial: my $ApproxMatchingQuantifier   = "40%";
# TheCerial: $matched						= amatch($FileName, $ApproxMatchingQuantifier, $TemporarySearchQuery);

# my $sentences			= get_sentences($text);				# returns an array ref
# my $FullContentArray	= &Main( $sentences	);
# $WordCount				= $#FullContent;

# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen


# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'


# reniceing to 20 !
# system ("renice 20 $$");


use strict;
use Text::German;
# use Text::English;
use Lingua::DE::ASCII;
# use Lingua::EN::Inflect;

... [truncated, 467 more lines] ...

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.2.pl", "description": "Perl module for ContentCleanerV0.2", "dateModified": "2007-01-14", "dateCreated": "2025-03-23", "contentSize": "12.4 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.2.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentCleanerV0.3.pl (Perl)

18.0 KB 2007-01-14

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.3

#!/usr/bin/perl 

#########################################
##### Author:		Sebastian Enger / B.Sc
##### CopyRight:	Sebastian Enger / B.Sc
##### LastModified	7.01.2007
##### Function:		Dublicated Content Filter fr Google
##### Todo:			
########################################

# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result	= Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
###	amazon content grabbing + adding

# string::approx benutzen 
# TheCerial: my $ApproxMatchingQuantifier   = "40%";
# TheCerial: $matched						= amatch($FileName, $ApproxMatchingQuantifier, $TemporarySearchQuery);

# my $sentences			= get_sentences($text);				# returns an array ref
# my $FullContentArray	= &Main( $sentences	);
# $WordCount			= $#FullContent;

# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen


# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'


# reniceing to 20 !
system("renice 20 $$");
system("clear");

use strict;
# use Text::German;
# use Text::English;
# use Lingua::DE::ASCII;
use Lingua::EN::Inflect;

... [truncated, 657 more lines] ...

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.3.pl", "description": "Perl module for ContentCleanerV0.3", "dateModified": "2007-01-14", "dateCreated": "2025-03-23", "contentSize": "18.0 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.3.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentCleanerV0.4.pl (Perl)

19.4 KB 2007-01-23

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.4

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.4.pl", "description": "Perl module for ContentCleanerV0.4", "dateModified": "2007-01-23", "dateCreated": "2025-03-23", "contentSize": "19.4 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.4.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentCleanerV0.5.pl (Perl)

19.5 KB 2007-01-24

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.5

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.5.pl", "description": "Perl module for ContentCleanerV0.5", "dateModified": "2007-01-24", "dateCreated": "2025-03-23", "contentSize": "19.5 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.5.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentCleanerV0.6.pl (Perl)

27.8 KB 2007-01-24

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.6

#!/usr/bin/perl 

#########################################
##### Author:		Sebastian Enger / B.Sc
##### CopyRight:	Sebastian Enger / B.Sc
##### LastModified	7.01.2007
##### Function:		Dublicated Content Filter fr Google
##### Todo:			
########################################

# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result	= Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
###	amazon content grabbing + adding

# my $sentences			= get_sentences($text);				# returns an array ref
# my $FullContentArray	= &Main( $sentences	);
# $WordCount			= $#FullContent;

# synonyme in format bringen
# synonyme vergleichen mit textdate und zu modifizierendem text
# wenn syn. nicht in text datei vorhanden dann benutze webservice
# ergebnisse vom webservice dann auch in unsere syn. datei hinzufgen


# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'
# perl -MCPAN -e 'install "Lingua::DE::Sentence"'
# perl -MCPAN -e 'install "Lingua::DE::TypoGenerator"'
# perl -MCPAN -e 'install "String::Approx"'
# perl -MCPAN -e 'install "Text::Levenshtein"'
# perl -MCPAN -e 'install "Text::LevenshteinXS"'
# /usr/lib/perl5/site_perl/5.8.7/Lingua/DE/Wortschatz.pm

# reniceing to 20 !
# system("renice 20 $$");
# system("clear");

use strict;
use Data::Dumper;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Text::LevenshteinXS qw(distance);
use Lingua::EN::Inflect;
use Lingua::DE::Sentence;

... [truncated, 944 more lines] ...

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.6.pl", "description": "Perl module for ContentCleanerV0.6", "dateModified": "2007-01-24", "dateCreated": "2025-03-23", "contentSize": "27.8 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.6.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentCleanerV0.7.pl (Perl)

28.2 KB 2007-01-24

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.7

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.7.pl", "description": "Perl module for ContentCleanerV0.7", "dateModified": "2007-01-24", "dateCreated": "2025-03-23", "contentSize": "28.2 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.7.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentCleanerV0.8.pl (Perl)

33.2 KB 2007-01-27

Copy Path View Perl Show Preview

Perl module for ContentCleanerV0.8

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentCleanerV0.8.pl", "description": "Perl module for ContentCleanerV0.8", "dateModified": "2007-01-27", "dateCreated": "2025-03-23", "contentSize": "33.2 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentCleanerV0.8.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentFilter.pl (Perl)

12.3 KB 2007-01-09

Copy Path View Perl Show Preview

Perl module for ContentFilter

#!/usr/bin/perl 

#########################################
##### Author:		Sebastian Enger / B.Sc
##### CopyRight:	Sebastian Enger / B.Sc
##### LastModified	7.01.2007
##### Function:		Dublicated Content Filter fr Google
##### Todo:			
########################################


use strict;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;

use Data::Dumper;


# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result	= Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
###	amazon content grabbing + adding


# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'


# englische funktionen:
	### Number2Word(): wandele eine zahl in ein englisches wort um
	### PluralManipulation(): bilde den plural von englischen wrtern
	### StemmmingManipulation(): reduzierung von englischen wrtern auf ihre grundform

# deutsche funktionen:
	### Zahl2Wort(): wandele eine zahl in ein deutsches wort um
	### SynonymManipulation(): zuflliges ersetzen von deutschen wrtern mit einem zuflligem synonym zum ursprnglichen wort
	### GrundformManipulation(): reduzierung von deutschen wrtern auf ihre grundform

# sprachunabhngige funktionen:
	### TextBlowup(): fge satzkombinationen zum array hinzu -> nimm randomized einzelne wrter aus dem vorhandenen Text - sortiere dieses nach alphabetischer reihenfolge - und speichere das ergebnis ans (aktuell:Ende) des zu modifizierenden Textes
	### StringManipulation(): buchstaben, zeichen, wrter spiegeln, vertauschen, lschen, ersetzen ...:
		###

... [truncated, 502 more lines] ...

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentFilter.pl", "description": "Perl module for ContentFilter", "dateModified": "2007-01-09", "dateCreated": "2025-03-23", "contentSize": "12.3 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentFilter.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

🐪 ContentFilterV0.1.pl (Perl)

12.3 KB 2007-01-09

Copy Path View Perl Show Preview

Perl module for ContentFilterV0.1

#!/usr/bin/perl 

#########################################
##### Author:		Sebastian Enger / B.Sc
##### CopyRight:	Sebastian Enger / B.Sc
##### LastModified	7.01.2007
##### Function:		Dublicated Content Filter fr Google
##### Todo:			
########################################


use strict;
use Text::German;
use Text::English;
use Lingua::DE::ASCII;
use Lingua::EN::Inflect;
use Lingua::DE::Num2Word;
use Lingua::DE::Wortschatz;

use Data::Dumper;


# todo:
# statische synonym textdatei nehmen und diese dann abarbeiten, wenn kein treffer gefunden wurde dann benutze das langsame my $result	= Lingua::DE::Wortschatz::use_service('T', $_);
# StringManipulation ist mir noch zu krass, der text wird extrem unleserlich bis jetzt noch
###	amazon content grabbing + adding


# perl -MCPAN -e 'install "Text::German"'
# perl -MCPAN -e 'install "Text::English"'
# perl -MCPAN -e 'install "Lingua::EN:Inflect"'
# perl -MCPAN -e 'install "Lingua::DE::Wortschatz"'
# perl -MCPAN -e 'install "Lingua::DE::Num2Word"'
# perl -MCPAN -e 'install "Lingua::DE::ASCII"'


# englische funktionen:
	### Number2Word(): wandele eine zahl in ein englisches wort um
	### PluralManipulation(): bilde den plural von englischen wrtern
	### StemmmingManipulation(): reduzierung von englischen wrtern auf ihre grundform

# deutsche funktionen:
	### Zahl2Wort(): wandele eine zahl in ein deutsches wort um
	### SynonymManipulation(): zuflliges ersetzen von deutschen wrtern mit einem zuflligem synonym zum ursprnglichen wort
	### GrundformManipulation(): reduzierung von deutschen wrtern auf ihre grundform

# sprachunabhngige funktionen:
	### TextBlowup(): fge satzkombinationen zum array hinzu -> nimm randomized einzelne wrter aus dem vorhandenen Text - sortiere dieses nach alphabetischer reihenfolge - und speichere das ergebnis ans (aktuell:Ende) des zu modifizierenden Textes
	### StringManipulation(): buchstaben, zeichen, wrter spiegeln, vertauschen, lschen, ersetzen ...:
		###

... [truncated, 502 more lines] ...

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "ContentFilterV0.1.pl", "description": "Perl module for ContentFilterV0.1", "dateModified": "2007-01-09", "dateCreated": "2025-03-23", "contentSize": "12.3 KB", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/ContentFilterV0.1.pl", "encodingFormat": "text/x-perl", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Perl" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

📄 readme.txt (Text)

51 bytes 2007-01-14

Copy Path View Text

Project documentation file

{ "@context": "https://schema.org", "@type": "SoftwareSourceCode", "name": "readme.txt", "description": "Project documentation file", "dateModified": "2007-01-14", "dateCreated": "2025-03-23", "contentSize": "51 bytes", "contentUrl": "https://www.artikelschreiber.com/opensource/contencleaner/version/readme.txt", "encodingFormat": "text/plain", "programmingLanguage": { "@type": "ComputerLanguage", "name": "Text" }, "codeRepository": "https://www.artikelschreiber.com/opensource/contencleaner/version/" }

contencleaner - version - SOURCE CODE

Project Overview

Source Code Files for free Download