2014 Drupal中国营提议:Drupal在网页数据采集方面的实践

We encourage users to post events happening in the community to the community events group on https://www.drupal.org.
g089h515r806's picture

我们经常遇到这样的需求:
1、定时采集新闻、文章等任何您想采集的内容,并自动发布到您的网站。

2、从指定网站抓取所需数据,通过分析和处理后保存到您的数据库。

3、通过自动采集,可以监控论坛等社区类网站,让您第一时间发现您所关注的内容。

4、可以批量下载PDF、RAR、图片等各种文件,并同时采集其相关信息。

这个讲座,将会简洁的介绍一下,我们在这方面的实践,
包括:
Feeds模块的基本概念
我们所使用的模块
大致功能介绍
演示抓取的效果

讲座的目标:
起到一个抛砖引玉的效果,让更多的人关注,Drupal的抓取功能,完全可以和火车头相媲美,而且直接构建在Drupal之上,具有自己独特的优势。

•发言人经验:
老葛
7年Drupal专职的开发经验,Drupal实战作者,多个知名模块的作者。

•参加者经验水平:初学者,中级或高级,皆可。

Comments

好啊,不错的主题

silas.xie's picture

好啊,不错的主题

g089h515r806's picture

我们在Drupal网页数据采集方面做了比较多的研究和实践了,技术上已经相对成熟完善了。

我的drupal博客Think in Drupal

cuijinlin's picture

很感兴趣,drupal做这个的 感觉好少,老葛的 案例是哪个?


Z-Turn, Life is colorful based on changes - http://www.z-turn.org/

g089h515r806's picture

案例,抓取京东,当当的数据,抓取各式数据,好几个网站都在用。

我的drupal博客Think in Drupal

非常期待!

fishfree's picture

非常期待!

希望对大家有用。

g089h515r806's picture

希望对大家有用。

我的drupal博客Think in Drupal

Thank you for proposing to

skyredwang's picture

Thank you for proposing to speak at DrupalCampChina 2014. Congratulations, we have selected your session, please see the schedule at https://groups.drupal.org/node/406128 .

感谢你向Drupal中国营2014建议的演讲话题。祝贺你,我们选择了你的话题,请在这里浏览时间表https://groups.drupal.org/node/406128

creatorwpy2's picture

好,可惜我看到的时候,已经是过去了。

Bei Jing (China)

Group organizers

Group notifications

This group offers an RSS feed. Or subscribe to these personalized, sitewide feeds:

Hot content this week