Hpricot - HTML Parser
Pracuji teď na projektu, který potřebuje parsovat HTML stránky. V Ruby prozatím neexistoval parser, který by byl dostatečně rychlý, tedy napsaný přímo v C. Pravidelně čtu blog RedHanded, na kterém autor právě začal před několika dny takovýto parser psát. Snaží se kombinovat dobré vlastnosti velice známých knihoven HTree, Prototype a JQuery.
Takto nějak vypadá kód:
require 'hpricot'
doc = Hpricot.parse("index.html")
(doc/:p/:a).each do |link|
p link.attributes
endNainstalovat a testovat můžete odtud:
# gem install hpricot --source code.whytheluckystiff.netPosted in Programování | no comments | atom