金山毒霸弹出天猫广告还总是wwWetiantian阻拦页面的弹出,除了这各站etiantianCom还有其他的吗

未找到信息!
未找到信息!
收录 / 索引信息
未找到信息!
一般不超过80字符
网站关键词
一般不超过100字符
一般不超过200字符
同主机安全
虚假或欺诈网站
挂马或恶意网站
未存在违规内容
alexa排名趋势
服务器信息
服务器类型
源文件大小
压缩后大小
最后修改时间
关闭关闭关闭北京四中网校
名师直播课
北京四中名师
未找到信息!
收录 / 索引信息
未找到信息!
北京四中网校-北京四中
一般不超过80字符
网站关键词
北京四中网校,北京四中,北京四中名师,名师直播课,在线学习,高效提分,高考,中考,网校,微课,考试技巧
一般不超过100字符
中国最大的远程基础教育服务机构和在线学习社区,帮助全国的中小学生通过名师在线直播、高清课程等方式,获得北京四中与全国各地名师提供的优质教学资源;帮助中小学生养成良好的学习习惯,提高分数。
一般不超过200字符
同主机安全
虚假或欺诈网站
挂马或恶意网站
未存在违规内容
alexa排名趋势
服务器信息
服务器类型
源文件大小
压缩后大小
最后修改时间
关闭关闭关闭已有 176 人访问
上海隐志网络科技有限公司> 博客详情
本文包含了上文的主要内容。
使用的python库lda来自: 。
库也含有lda相关函数。
$ pip install lda --user
from __future__ import division, print_function
import numpy as np
import lda
import lda.datasets
# document-term matrix
X = lda.datasets.load_reuters()
print(&type(X): {}&.format(type(X)))
print(&shape: {}\n&.format(X.shape))
print(X[:5, :5])
type(X): &type 'numpy.ndarray'&
shape: (395L, 4258L)
X为395*4298的矩阵,意味着395个文本,共4258个单词。值代表出现次数。
看一下是哪些单词:
# the vocab
vocab = lda.datasets.load_reuters_vocab()
print(&type(vocab): {}&.format(type(vocab)))
print(&len(vocab): {}\n&.format(len(vocab)))
print(vocab[:6])
type(vocab): &type 'tuple'&
len(vocab): 4258
('church', 'pope', 'years', 'people', 'mother', 'last')
X中第0列对应的单词是church,第1列对应的单词是pope
下面看一下文章标题:
# titles for each story
titles = lda.datasets.load_reuters_titles()
print(&type(titles): {}&.format(type(titles)))
print(&len(titles): {}\n&.format(len(titles)))
print(titles[:2])
# 前两篇文章的标题
type(titles): &type 'tuple'&
len(titles): 395
('0 UK: Prince Charles spearheads British royal revolution. LONDON ', '1 GERMANY: Historic Dresden church rising from WW2 ashes. DRESDEN, Germany ')
训练数据,指定20个主题,500次迭代:
model = lda.LDA(n_topics=20, n_iter=500, random_state=1)
model.fit(X)
主题-单词(topic-word)分布:
topic_word = model.topic_word_
print(&type(topic_word): {}&.format(type(topic_word)))
print(&shape: {}&.format(topic_word.shape))
type(topic_word): &type 'numpy.ndarray'&
shape: (20L, 4258L)
topic_word中一行对应一个topic,一行之和为1。 看一看'church', 'pope', 'years'这三个单词在各个主题中的比重:
print(topic_word[:, :3])
获取每个topic下权重最高的5个单词:
for i, topic_dist in enumerate(topic_word):
topic_words = np.array(vocab)[np.argsort(topic_dist)][:-(n+1):-1]
print('*Topic {}\n- {}'.format(i, ' '.join(topic_words)))
- government british minister west group
- church first during people political
- elvis king wright fans presley
- yeltsin russian russia president kremlin
- pope vatican paul surgery pontiff
- family police miami versace cunanan
- south simpson born york white
- order church mother successor since
- charles prince diana royal queen
- film france french against actor
- germany german war nazi christian
- east prize peace timor quebec
- n't told life people church
- years world time year last
- mother teresa heart charity calcutta
- city salonika exhibition buddhist byzantine
- music first people tour including
- church catholic bernardin cardinal bishop
- harriman clinton u.s churchill paris
- century art million museum city
文档-主题(Document-Topic)分布:
doc_topic = model.doc_topic_
print(&type(doc_topic): {}&.format(type(doc_topic)))
print(&shape: {}&.format(doc_topic.shape))
type(doc_topic): &type 'numpy.ndarray'&
shape: (395, 20)
一篇文章对应一行,每行的和为1。
输入前10篇文章最可能的Topic:
for n in range(10):
topic_most_pr = doc_topic[n].argmax()
print(&doc: {} topic: {}&.format(n, topic_most_pr))
doc: 0 topic: 8
doc: 1 topic: 1
doc: 2 topic: 14
doc: 3 topic: 8
doc: 4 topic: 14
doc: 5 topic: 14
doc: 6 topic: 14
doc: 7 topic: 14
doc: 8 topic: 14
doc: 9 topic: 8
支付宝支付
微信扫码支付
打赏金额: ¥
已支付成功
打赏金额: ¥}

我要回帖

更多关于 电脑频繁弹出金山毒霸 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信