欢迎来到人人有站代理平台牛B產品+牛B服务+牛B方案助力企业全网营销牛起来?
互联网营销产业链融合平台
微信IOS协议牛B采集 ??
扫一扫手机查看更多资讯,并给你提供免费解决方案!??
已经通过C#的爬虫程序采集到了想要的内容内容是任何网站的,不是专门针对某个网站嘚
内容中包含有如:学校名称,地址电话等信息,有什么办法可以分别提取出来呢
提取的要求是:学校名称,地址、电话是对应的即:XX学校,对应的地址是XX市XX街道电话是:010-888888, 因为这些字段我要分别存入数据库的不同字段的
用正则先花30分钟看一下这篇文章
内容是任何网站的,不是专门针对某个网站的
这一点就代表了你的空想。。。
所有的正则都是针对特定字符串的
一般对特定网站抓取,偠写特定的正则
而你要求的可以抓取任何网站的信息,那么你只能抓取链接和图片其他的文字,你不好区分所以没办法抓到“学校洺称,地址、电话是对应的即:XX学校,对应的地址是XX市XX街道电话是:010-888888”
太高深了,没用过呵呵孤陋寡闻了
不用想啦,你连采集都不會的话很难实现的。
而且你要采集的是敏感信息特别是电话
一般人家用js或者图片来显示难度就更高了。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。