PHP Класс Phpml\FeatureExtraction\TokenCountVectorizer

Наследование: implements Phpml\Transformer
Показать файл Открыть проект Примеры использования класса

Открытые методы

Метод Описание
__construct ( Phpml\Tokenization\Tokenizer $tokenizer, StopWords $stopWords = null, float $minDF )
fit ( array $samples )
getVocabulary ( ) : array
transform ( array &$samples )

Приватные методы

Метод Описание
addTokenToVocabulary ( string $token )
buildVocabulary ( array &$samples )
checkDocumentFrequency ( array &$samples ) : array
getBeyondMinimumIndexes ( integer $samplesCount ) : array
getTokenIndex ( string $token ) : integer | boolean
isStopWord ( string $token ) : boolean
resetBeyondMinimum ( array &$sample, array $beyondMinimum )
transformSample ( string &$sample )
updateFrequency ( string $token )

Описание методов

__construct() публичный Метод

public __construct ( Phpml\Tokenization\Tokenizer $tokenizer, StopWords $stopWords = null, float $minDF )
$tokenizer Phpml\Tokenization\Tokenizer
$stopWords StopWords
$minDF float

fit() публичный Метод

public fit ( array $samples )
$samples array

getVocabulary() публичный Метод

public getVocabulary ( ) : array
Результат array

transform() публичный Метод

public transform ( array &$samples )
$samples array