PHP Class PicoFeed\Scraper\Scraper

Author: Frederic Guillot
Inheritance: extends PicoFeed\Base
Afficher le fichier Open project: fguillot/picofeed Class Usage Examples

Méthodes publiques

Méthode Description
disableCandidateParser ( ) : Scraper Disable candidates parsing.
download ( ) : boolean Download the HTML content.
execute ( $pageContent = '', $recursionDepth ) Execute the scraper.
getEncoding ( ) : string Get encoding.
getFilteredContent ( ) : string Get filtered relevant content.
getParser ( ) : PicoFeed\Scraper\ParserInterface Get the parser.
getRawContent ( ) : string Get raw content (unfiltered).
getRelevantContent ( ) : string Get relevant content.
getUrl ( ) : string Get URL to download.
hasRelevantContent ( ) : boolean Return true if the scraper found relevant content.
prepareHtml ( ) Normalize encoding and strip head tag.
setEncoding ( string $encoding ) : Scraper Set encoding.
setRawContent ( string $html ) : Scraper Set raw content (unfiltered).
setUrl ( string $url ) : Scraper Set URL to download.

Method Details

disableCandidateParser() public méthode

Disable candidates parsing.
public disableCandidateParser ( ) : Scraper
Résultat Scraper

download() public méthode

Download the HTML content.
public download ( ) : boolean
Résultat boolean

execute() public méthode

Execute the scraper.
public execute ( $pageContent = '', $recursionDepth )

getEncoding() public méthode

Get encoding.
public getEncoding ( ) : string
Résultat string

getFilteredContent() public méthode

Get filtered relevant content.
public getFilteredContent ( ) : string
Résultat string

getParser() public méthode

Get the parser.
public getParser ( ) : PicoFeed\Scraper\ParserInterface
Résultat PicoFeed\Scraper\ParserInterface

getRawContent() public méthode

Get raw content (unfiltered).
public getRawContent ( ) : string
Résultat string

getRelevantContent() public méthode

Get relevant content.
public getRelevantContent ( ) : string
Résultat string

getUrl() public méthode

Get URL to download.
public getUrl ( ) : string
Résultat string

hasRelevantContent() public méthode

Return true if the scraper found relevant content.
public hasRelevantContent ( ) : boolean
Résultat boolean

prepareHtml() public méthode

Normalize encoding and strip head tag.
public prepareHtml ( )

setEncoding() public méthode

Set encoding.
public setEncoding ( string $encoding ) : Scraper
$encoding string
Résultat Scraper

setRawContent() public méthode

Set raw content (unfiltered).
public setRawContent ( string $html ) : Scraper
$html string
Résultat Scraper

setUrl() public méthode

Set URL to download.
public setUrl ( string $url ) : Scraper
$url string URL
Résultat Scraper