如何舆情调查，舆情监测都有哪些方法

本文目录一览

1，舆情监测都有哪些方法
2，免费查舆情数据信息的方法有哪些呢
3，一般舆情采集都有哪些方法需要考虑什么
4，如何有效进行网络舆情分析
5，全网舆情监测的手段都有哪些
6，网络舆情是怎么监测的主要通过什么途径

1，舆情监测都有哪些方法

1、访问调查； 2、用百度搜索引擎查询； 3、用专业千寻舆情软件查询、处理。

舆情监测主要有元搜索，关键词搜索，分类搜索和高级搜索！（北京政研院）

舆情监测都有哪些方法

2，免费查舆情数据信息的方法有哪些呢

网络舆情信息数据的杂乱，因此，对于舆情信息查找肯定需要借助一些方法技巧的。当前，用的多可能就是借助搜索引擎检索，然后再由人工进行筛选排查。此种方式，无法避免会遇到遇到信息获取不全面、不及时、重复信息过多等问题。所以，对于舆情信息查找，建议可以采取网络技术手段辅助人工收集的方式。如可以采购蚁放软件这类专业的舆情信息查询统计软件，或者找第三方舆情监测公司合作，由专业队伍专人负责查找舆情信息。

免费查舆情数据信息的方法有哪些呢

3，一般舆情采集都有哪些方法需要考虑什么

简单笼统的说：自己做或者找提供舆情服务的公司；人工采集或者软件监测。需要考虑的无非就是信息全不全，准不准，及不及时等等。舆情监测系统的数据是经过过滤、分析和挖掘的，具有丰富的统计数据，所采集的信息范围是定向的，是用户关注的特定区域、特定领域的网站，针对这些网站可以做到全面采集和准确精确。可以做到对新闻，论坛，博客，贴吧等舆情载体的全面采集，尤其是针对论坛，博客这些“草根”媒体（这些媒体往往是舆情高发区域），实现全面、迅速的舆情采集的同时，可以采集信息的点击数，回复数，转载数等等。大多数有相关需求的用户都会考虑自己采购一套舆情系统，毕竟在社会化媒体时代：无论你知不知道，无论你想不想听，人们都在谈论你！并对你造成直接、间接、甚至是致命的影响。因此，在社会化媒体时代，网络舆情监控和品牌预警是势在必行。

一般舆情采集都有哪些方法需要考虑什么

4，如何有效进行网络舆情分析

这个倒是有几方面网络舆情分析，据新舆盾的总结来说具体说来有以下几种方法可以快速抓取信息进行分析：一、人海浏览法人海浏览法是指通过对各网站网页的人工查阅而了解网上舆情的方法。这种方法具有信息查阅精准、内容反映周详、舆情可靠性强和报告集成较慢、人力投入巨大、容易存在遗漏等特点。二、关键词搜索法关键词搜索法是指根据目标舆情信息的话语特征，选择“关键词，”借助网络搜索引擎，通过人工或新舆盾等平台进行舆情信息搜集的方法。三、多文档精选法多文档精选法是在网络舆情研判中通过对涉及目标舆情信息的文档摘要，反映舆情内容本质的一种方法。四、模板因子法模板因子法是通过对网络舆情的历史分析，依据其发生发展规律，可在专业平台上建立相应的网络舆情形势模板，并提取其相关作用因子作为网络舆情研判的一种分析方法。五、网络实验法网络实验法是将网络舆情事件通过模拟的网络环境进行实验，进而分析其变化发展的情况。

不明白啊 = =！

5，全网舆情监测的手段都有哪些

全网舆情监测的手段：数据源的获取是做舆情监测的第一步，有了米才能做粥嘛。从获取的方法上有简单的取巧办法，也有复杂到需要应对各类网站难题的情况。方法大致如下：使用搜索入口作为捷径搜索入口有两类：一类是搜索引擎的入口，一类是网站的站内搜索。做舆情监测往往是有主题、有定向的去做，所以很容易就可以找到监测对象相关的关键字，然后利用这些关键字去各类搜索入口爬取数据。当然也会遇到反扒的问题，例如你长时间、高频次的爬取搜索引擎的结果页面，网站的反扒策略就会被触发，让你输入验证码来核实是否是人类行为。使用搜索入口作为捷径也会带来一些好处，除了爬取门槛低，不需要自己收录各类网站信息外，另一个特别明显的好处是可验证性非常好，程序搜索跟人搜索的结果会是一致的，所以人很难验证出你获取的数据有偏颇。爬虫根据网站入口遍历爬取网站内容第一步要规划好待爬取的网站有哪些？根据不同的业务场景梳理不同的网站列表，例如主题中谈到的只要监测热门的话题，这部分最容易的就是找门户类、热门类网站，爬取他们的首页推荐，做文章的聚合，这样就知道哪类是最热门的了。思路很简单，大家都关注的就是热门。至于内容网站怎么判断热门，这个是可以有反馈机制的：一类是编辑推荐；一类是用户行为点击收集，然后反馈排序到首页。第二步是使用爬虫获取数据。爬虫怎么写是个非常大的话题，在这里不展开说明，需要提一嘴的是，爬虫是个门槛很低但是上升曲线极高的技术。难度在于：网站五花八门；反扒策略各有不同；数据获取后怎么提取到想要的内容。数据检索与聚合数据获取下来后哪些是你关心的、哪些是垃圾噪声，需要用一些NLP处理算法来解决这些问题。这方面门槛高、难度大。首先大规模的数据如何被有效的检索使用就是个难题。比如一天收录一百万个页面（真实环境往往比这个数量级高很多），上百G的数据如何存储、如何检索都是难题。值得高兴的是业内已经有一些成熟的方案，比如使用solr或者es来做存储检索，但随着数据量的增多、增大，这些也会面临着各种问题。通常对热门的判断逻辑是被各家网站转载、报道的多，所以使用NLP的手段来做相似性计算是必须的，业内常用的方法有Simhash或者计算相似性余弦夹角。有些场景不单单是文章相似，还需要把类似谈及的文章都做聚合，这时就需要用到一些聚类算法，例如LDA算法。从实践经验来看，聚类算法的效果良莠不齐，需要根据文本特征的情况来测试。目前舆情监测的现状存在很多待改进的地方。首先，手工监测存在天然局限性。通过安排固定人手24小时值班，不间断地浏览目标站点并搜索目标关键词，是在缺少自动化系统时最直接也是最初级的舆情监测方式。由于受到每个人主观思想的限制，手工监测总会有观察盲区，总会有觉得不重要但事后被证明很严重的地方，且手工无法察觉到一些站点或者一些偏僻的网页内容发生改变；同时，人不是机器，长期反复监测容易导致疲劳，经常会使得该判断出来的舆情，一不留神就漏掉了。这些都会在实时性和准确性上存在很大波动。其次是过度依赖搜索引擎。人们往往认为在网络舆情的大海里也只有搜索引擎才可能具备捞针的本领。但是，搜索引擎仍然具有不少局限性。除了搜索结果受关键词影响很大外，搜索引擎返回的结果往往来自不受任何访问限制的网站，而诸如论坛等需要登录的网站则完全被排除在外。但是网民发表意见最多的地方，恰恰是这些提供互动功能的网站。更进一步的，搜索引擎的网络爬虫具有一定的时延性，因此不能实时搜索到最新的网页更新。因此，搜索引擎不能为我们提供问题的全貌，因为它只针对关键词而不针对问题，所以谈不上全面性；搜索引擎也不能在第一时间得到我们所想要的结果，因为不仅是它的内容更新不够快，而且它也不能提供针对时效性的服务，所以谈不上及时性；搜索引擎只能在海量网页中返回另一个海量的结果，而且是以杂乱无章的形式，对于我们关心什么，它一无所知，所以它给出的结果是所有人都关心的，而非我关心的，因此也谈不上准确性。可见，我们不能完全依赖搜索引擎来监测网络舆情，需要提出全新的技术手段来获知网络舆情，并跟踪和分析舆情。因此，要想保证舆情监测的实时性、全面性和准确性，最可靠的办法就是使用自动化的多瑞科舆情数据分析站系统舆情监测系统，依靠软件系统来消除人工方式的不足，依靠软件系统来定点的监测目标站点及整个网络，跟踪分析各个舆情主题的发展轨迹，并自动地整理生成日报/周报等报告，将舆情与政府的日常工作业务有机整合在一起口碑监测的话，那目前市场上的监测产品基本都是付费的据我了解，试用期开的功能也非常有限。介绍个舆情监测产品按月付款“多瑞科舆情数据分析站系统”，因为只开了试用期，有些功能貌似没给我开，试用期一周用下来，总体感觉如还是好，因为我是化妆品行业的，在微博的数量太多了，跟真实数量对得起还是很满意。而在用户画像、数据报表这块，基本都是有数据的，特别是数据报告图表很丰富，现在一直在使用。类似市面上的系统TANK，人民网等等做得比较好，就是价格贵得想吐血。

依靠人工来完成这么庞大的工作量不可取，一是费时费力，二是容易有错漏，建议通过舆情监测系统，依靠软件系统来消除人工方式的不足，清博舆情可以实现全网数据分钟级抓取，自动判断情感属性、相似文章，舆情实时预警，自动地整理生成日报/周报等报告，能够充分满足政府单位以及企业对于舆情监测的需求。

6，网络舆情是怎么监测的主要通过什么途径

1.监测方式（1）搜索引擎。利用百度、360、搜狗等多种搜索引擎，输入相关的关键词，查找舆情信息。例如，使用“百度”引擎，在搜索栏中输入“多瑞科”。（2）定向搜索。利用省内外网站、微博微信、新闻客户端中的检索功能，输入特定的关键词进行搜索，并将搜索内容按时序排序，逐条查看。比如在检索条中输入“多瑞科舆情服务”等。（3）专业软件。购买专业的网络舆情监控软件，通过关键字布控和语义分析识别等智能技术，利用自动信息采集和人工干预相结合的方式进行网络舆情信息监测和收集。2.监测范围（1）中央级网站:人民网、新华网、央广网、中国新闻网、光明网、中国网、中青网等PC端和新闻客户端；（2）主要商业网站：新浪、腾讯、凤凰、网易、搜狐等PC端和新闻客户端；（3）重点媒体：澎湃网、新京报、南方都市报等；（4）重要论坛：人民网地方领导留言板、天涯社区、百度贴吧、凯迪社区、网易论坛、搜狐社区、新浪论坛等；（5）新媒体：新浪、腾讯微博，微信公众号等。3.判断的依据（1）首发网站。舆情首次刊发是在新闻网站、论坛网站还是在微博微信，在中央网站还是地方网站，在知名论坛还是普通论坛等；（2）刊发位置。舆情刊发的位置在网站首页还是在分频道，在网站的要闻区还是在其他版块等；（3）舆情类别。舆情内容是文字、图片、视频，还是图文结合、视频文字结合等。通常有图片或视频的舆情更容易引起网络关注；（4）发布作者。发布作者是认证用户还是普通用户，是“大V”还是一般网民，是老用户还是新注册用户，粉丝数有多少等；（5）传播情况。包括舆情传播范围、单元时间内点击数、帖文转发数、跟帖数、点赞数等。网络舆情主要是指整合互联网信息采集技术及信息智能处理技术，通过对互联网海量信息自动定向抓取、自动分类聚类、主题检测、专题聚焦，实现用户的网络舆情监测和新闻专题追踪等信息需求，形成简报、报告、图表等分析结果，为客户全面掌握群众思想动态，做出正确舆论引导，提供分析依据。目前我们在用的类似免费试用的多瑞科舆情数据分析站系统都是满足舆情监测系统的选择标准说说网络舆情监测的过程:一、通过人际交互建立舆情监控的数据分析库，以指导之后的智能分析的过程。二、对热点问题和重点信息领域，如：微博、博客、论坛、BBS等，进行24小时跟踪监控和更新下载。三、对下载的信息进行数据格式的转换及元数据的标引，并进行初步的过滤和预处理。四、在基于传统基于向量空间的特征分析技术上完成信息的二次过滤，对抓取的内容做分类、聚类、摘要等分析。五、基于舆情监控数据分析库指导，对再组织的舆情信息进行针对性的内容语义分析，使管理者看到的民情民意更有效，更符合现实。六、将监控分析结果及数据分析报告，推送至相关职能部门，以供制定对策使用。选购标准也有以下建议：1、舆情监测系统监测的全面性。舆情软件监测是否是全网监测，新闻、贴吧，论坛，博客，微博，微信，新媒体，APP手机端新闻，游戏网站，视频，电子平媒等；2、监测的是否及时，舆情最注重的就是时效性，如果不能及时监测到，那么舆情监测系统就失去了使用的意义，一般现在市面上的软件监测事件均在半小时以内；对海量数据进行清洗，自动聚类、分类、自动研判信息属性、过滤垃圾信息，并对有效的舆情信息进行精准的快速的推送，这些参数都是相当的重要。3、监测是否准确，与汽车企业相关的互联网舆情仅仅一天的数据可能达到数十万甚至是数百万，但是可用的有效的舆情信息，却只有一小部分。那么这对于舆情监测系统的舆情分析能力就提出了比较高的要求。4.可以根据实际情况修改LOGO和定制特色功能。

数据源的获取是做舆情监测的第一步，有了米才能做粥嘛。从获取的方法上有简单的取巧办法，也有复杂到需要应对各类网站难题的情况。方法大致如下：使用搜索入口作为捷径搜索入口有两类：一类是搜索引擎的入口，一类是网站的站内搜索。做舆情监测往往是有主题、有定向的去做，所以很容易就可以找到监测对象相关的关键字，然后利用这些关键字去各类搜索入口爬取数据。当然也会遇到反扒的问题，例如你长时间、高频次的爬取搜索引擎的结果页面，网站的反扒策略就会被触发，让你输入验证码来核实是否是人类行为。使用搜索入口作为捷径也会带来一些好处，除了爬取门槛低，不需要自己收录各类网站信息外，另一个特别明显的好处是可验证性非常好，程序搜索跟人搜索的结果会是一致的，所以人很难验证出你获取的数据有偏颇。爬虫根据网站入口遍历爬取网站内容第一步要规划好待爬取的网站有哪些？根据不同的业务场景梳理不同的网站列表，例如主题中谈到的只要监测热门的话题，这部分最容易的就是找门户类、热门类网站，爬取他们的首页推荐，做文章的聚合，这样就知道哪类是最热门的了。思路很简单，大家都关注的就是热门。至于内容网站怎么判断热门，这个是可以有反馈机制的：一类是编辑推荐；一类是用户行为点击收集，然后反馈排序到首页。第二步是使用爬虫获取数据。爬虫怎么写是个非常大的话题，在这里不展开说明，需要提一嘴的是，爬虫是个门槛很低但是上升曲线极高的技术。难度在于：网站五花八门；反扒策略各有不同；数据获取后怎么提取到想要的内容。数据检索与聚合数据获取下来后哪些是你关心的、哪些是垃圾噪声，需要用一些nlp处理算法来解决这些问题。这方面门槛高、难度大。首先大规模的数据如何被有效的检索使用就是个难题。比如一天收录一百万个页面（真实环境往往比这个数量级高很多），上百g的数据如何存储、如何检索都是难题。值得高兴的是业内已经有一些成熟的方案，比如使用solr或者es来做存储检索，但随着数据量的增多、增大，这些也会面临着各种问题。通常对热门的判断逻辑是被各家网站转载、报道的多，所以使用nlp的手段来做相似性计算是必须的，业内常用的方法有simhash或者计算相似性余弦夹角。有些场景不单单是文章相似，还需要把类似谈及的文章都做聚合，这时就需要用到一些聚类算法，例如lda算法。从实践经验来看，聚类算法的效果良莠不齐，需要根据文本特征的情况来测试。目前舆情监测的现状存在很多待改进的地方。首先，手工监测存在天然局限性。通过安排固定人手24小时值班，不间断地浏览目标站点并搜索目标关键词，是在缺少自动化系统时最直接也是最初级的舆情监测方式。由于受到每个人主观思想的限制，手工监测总会有观察盲区，总会有觉得不重要但事后被证明很严重的地方，且手工无法察觉到一些站点或者一些偏僻的网页内容发生改变；同时，人不是机器，长期反复监测容易导致疲劳，经常会使得该判断出来的舆情，一不留神就漏掉了。这些都会在实时性和准确性上存在很大波动。其次是过度依赖搜索引擎。人们往往认为在网络舆情的大海里也只有搜索引擎才可能具备捞针的本领。但是，搜索引擎仍然具有不少局限性。除了搜索结果受关键词影响很大外，搜索引擎返回的结果往往来自不受任何访问限制的网站，而诸如论坛等需要登录的网站则完全被排除在外。但是网民发表意见最多的地方，恰恰是这些提供互动功能的网站。更进一步的，搜索引擎的网络爬虫具有一定的时延性，因此不能实时搜索到最新的网页更新。因此，搜索引擎不能为我们提供问题的全貌，因为它只针对关键词而不针对问题，所以谈不上全面性；搜索引擎也不能在第一时间得到我们所想要的结果，因为不仅是它的内容更新不够快，而且它也不能提供针对时效性的服务，所以谈不上及时性；搜索引擎只能在海量网页中返回另一个海量的结果，而且是以杂乱无章的形式，对于我们关心什么，它一无所知，所以它给出的结果是所有人都关心的，而非我关心的，因此也谈不上准确性。可见，我们不能完全依赖搜索引擎来监测网络舆情，需要提出全新的技术手段来获知网络舆情，并跟踪和分析舆情。因此，要想保证舆情监测的实时性、全面性和准确性，最可靠的办法就是使用自动化的多瑞科舆情数据分析站系统舆情监测系统，依靠软件系统来消除人工方式的不足，依靠软件系统来定点的监测目标站点及整个网络，跟踪分析各个舆情主题的发展轨迹，并自动地整理生成日报/周报等报告，将舆情与政府的日常工作业务有机整合在一起

文章TAG：如何舆情调查舆情监测都有哪些方法