项目>

达观数据:深耕企业文本数据挖掘服务

达观数据:深耕企业文本数据挖掘服务

  • 推荐系统
  • 搜索引擎
  • 文本语义理解
  • 用户画像
  • 数据采集挖掘
  • 大数据
  • 用户行为分析

收藏

达而观信息科技(上海)有限公司

达观数据是专注于企业大数据服务的高科技创业公司,致力于为新媒体、电商、视频、金融、企业等提供最专业的大数据挖掘技术服务。核心团队来自腾讯、盛大、阿里、百度大数据部门,获得了真格基金等联合投资,由原盛大文学首席数据官和腾讯文学高级总监陈运文博士担任CEO。达观在文本语义分析、用户行为挖掘方面申请有二十余项国家发明专利,曾摘取ACM KDD CUP、CIKM等世界著名大数据竞赛的冠军荣誉,以独创的多层次智能挖掘算法,实现对海量用户行为和文本数据的深入分析和挖掘,为企业提供智能文本分析、精准用户行为建模、个性化推荐、智能搜索等尖端数据挖掘功能,快速帮助大量企业完成大数据挖掘系统部署,提升企业运营效率和利润,真正让大数据技术为企业创造价值。

发展历程

  • 2017-04-11

    获得A轮融资5000万元,软银赛富领投,方广资本跟投

  • 2017-03-17

    成为首席数据官联盟成员

  • 2016-12-15

    获得I黑马“2016人工智能创新公司”

  • 2016-12-09

    获得36氪“2016最具影响力大数据挖掘技术服务商”

  • 2016-10-17

    获得第五届中国创新创业大赛优秀企业奖

  • 2016-09-24

    获得2016中国青年互联网创业大赛全国总冠军

  • 2016-08-01

    达观数据入选第九期联想之星

  • 2016-05-10

    入驻36Kr企业服务平台,并荣获其中国最靠谱数据分析服务商

  • 2016-04-21

    获2016“创新中国”全国创新创业大赛企业服务组竞赛冠军

  • 2016-03-05

    创始人陈运文博士获得2016年度“张江优秀人才”荣誉

  • 2016-03-03

    作为技术服务商成功入驻阿里云、七牛云、京东云、Ucloud

  • 2016-01-25

    联合复旦大学贵州大数据研究院筹备成立联合研究中心

  • 2015-12-17

    获得《第一财经》“寻找独角兽”全球创新大赛亚军,银独角兽大奖

  • 2015-12-04

    荣获真格基金领投1000万天使投资,众麟资本、掌门科技跟投

  • 2015-08-01

    由百度、腾讯和盛大大数据技术骨干组建的达观数据正式成立

  • 2015-01-28

    成为上海市大数据联盟理事单位,和复旦大学成立联合实验室

项目介绍:

一、个性化推荐引擎

推荐111.png

针对每个用户的偏好,进行“千人千面”的智能内容推荐,有效提升用户活跃度、停留时长、付费率、留存率等关键指标。

 

产品功能

个性化推荐:深入分析用户行为记录,挖掘用户的兴趣爱好,向用户推荐其感兴趣的信息和商品。

相关推荐:通过深入分析网站产品之间的内在相关性,根据当前被浏览的某个产品为用户推荐其产品。

热门推荐:为网站提供全站热门商品排行榜和分类热门商品排行榜,以满足大部分用户的兴趣与需求。

 

优势

1)达观专利的双叠组合算法,效果优异,多次获得国际算法竞赛冠军

达观业界顶尖的专利算法,为客户深度调优,为客户带来最优的推荐转化;

达观的离线-近线-在线的三层系统架构,兼顾强大的算法和灵活的服务;

基于机器学习的重排序框架,自动为客户应用场景配置算法的最优组合。

2)突破传统推荐单调和重复的问题,有力提升推荐的多样性和新颖性

多维度挖掘用户长短期兴趣画像,精准把脉用户偏好诉求;

多策略融合优化推荐的多样性、新颖性、时效性,给用户惊喜的结果;

反馈迅速,秒级响应用户点击行为,实时更新推荐结果。

3)采用多种策略改善冷启动用户推荐质量,有效提升新用户留存率

基于高性能计算框架,秒级生成新用户画像,确保留存;

基于海量用户行为历史数据,挖掘多样性的高质量个性化推荐结果;

不断吸收引进前沿的预测算法,对用户实时兴趣和个性化需求进行精准预测。

 

二、垂直搜索引擎

搜索111.png

对企业的海量文章、商品、内容等信息进行深入语义分析,建立功能强大的垂直搜索引擎,实现快速、准确的搜索服务。

 

产品功能

搜索筛选:根据用户输入的查询词实时返回相关搜索结果,并支持对结果进行筛选和排序。

意图识别:当用户出现单词拼写错误、乱用同音字、文字错输为拼音时,系统自动识别纠错。

内容理解:根据用户当前已经输入的部分查询词自动提示完整的查询关键词。

搜索联想:系统推荐与当前搜索词相关的其他搜索词,帮助用户进行联想式查询。

 

优势

1)国内顶尖的搜索结果排序算法,达成优异的搜索结果满意度

顶尖的多轮重查、意图理解、动态丢词算法,实现极高的搜索准确率;

丰富的垂直行业搜索系统开发经验,针对行业规律和搜索场景提供专业优化;

定期采集搜索行为日志,针对问题不断升级算法,确保优异的搜索品质。

2)达观独有的搜索意图分析模块,以及提升用户体验的各类配套模块

搜索意图分析模块自动对搜索词进行语义理解和意图识别,发现用户需求;

自动挖掘用户行为,提供超出字面匹配的语义搜索结果,提升搜索转化率;

完整提供搜索提示、自动纠错、结果摘要等配套功能,改善用户体验。

3)性能强大,服务稳定,反应灵敏,并提供丰富的统计报表和管理系统

性能强大,基于分布式架构,支持亿级内容吞吐,索引更新达到秒级;

反应灵敏,独有的实时索引更新架构,实现新内容秒级更新机制;

配置丰富,提供各类人工配置和管理功能,随时查看数据和调整排序。

 

三、文本语义理解

文本111.png

针对自然语言处理的不同层次问题提供完善的解决方案,从分词到命名实体识别,从标签提取到文本分类,从垃圾过滤到黄反识别,满足不同的需求。

 

产品功能

垃圾评论:精准识别广告、不文明用语及低质量文本。

黄反识别:准确定位文本中所含涉黄、涉政及反动内容。

标签提取:提取文本中的核心词语生成标签。

文章分类:依据预设分类体系对文本进行自动归类。

情感分析:准确分析用户透过文本表达出的情感倾向。

 

优势

1)针对客户所在行业,定制专用文本模型和知识图谱,确保语义挖掘效果
构建行业专属语义模型,自动提取专有词汇和核心语义;

构建客户垂直行业的知识图谱,以特有的结构化方式分析文字含义;
持续采集和更新行业专用语料和知识资源,为客服长期服务。
2)达观独有的多层文本算法融合模型,实现最佳文本处理效果
达观多层模型智能融合了数十种文本挖掘算法,灵活满足各类文字处理需求;

针对中英文语言特点,针对性开发词汇级、短串级、篇章级三级语义模型;
根据客户反馈持续优化模型,确保服务品质和实时响应能力。

3)利用前沿的深度学习技术,帮助客户深入理解文字背后的含义
基于最新深度学习技术和神经网络,提取海量文本数据的潜在特征;
结合经典的n-gram特征和概率模型,使用表示学习优化特征提取;
充分运用增强学习技术,通过少量标注数据即可提升模型训练效果。

 

四 数据采集挖掘

采集111.png

利用最先进的数据挖掘技术,为企业捕捉全网信息,基于海量数据和精准算法,就网站的流量走势、用户行为、产品销量等进行准确预测。

 

产品功能:

数据抓取:实现微信公众号数据的定向抓取,包括公众号文章、阅读数、点赞数,并支持对文章进行分组、筛选、排序等多样操作管理。

数据采集:对不同终端各类数据进行统计分析,以形式多样的数据统计报表在“达观大数据平台”展现流量、产品、用户和渠道信息。

数据预测:基于海量数据和精准算法,达观可根据网站的流量走势、用户行为、产品销量等数据进行准确预测。

 

优势:

1)定向抓取微信公众号各种数据

根据企业需要,抓取特定类别公众号的相关数据,包括点赞数、阅读数、粉丝数和发布时间等。

2)实时统计分析不同终端各类数据

针对移动端和PC端的不同类型的海量数据,实现数据可视化分析统计,方便企业使用。

3)支持PC端与移动端双平台数据实时查看

企业可通过PC端查看所抓取数据的情况,亦可通过移动端随时随地了解数据详情,实现双平台无缝衔接支持企业实时查看。

4)支持企业在大数据平台按需配置

企业可在达观大数据平台对所抓取的公众号进行自定义标签添加,也可通过输入文章地址人工添加公众号,实现机器与人工的互补。

 

五、用户画像

用户画像11.png

利用最先进的用户信息分析技术提炼高度精确的特征标识,根据用户的社会属性、生活习惯和消费行为等信息抽象出一个标签化的用户模型。   

 

产品功能:

用户统计:基于用户的的行为记录,准确统计某一类产品的目标用户群体,帮助企业透过用户行为表象洞察用户深层动机。

精准运营:分析用户在物品、品牌、类别、标签等维度上的偏好程度,根据用户价值细分核心用户,做出针对性的运营。

 

优势:

1)多维度挖掘数据信息获悉完整条件数据

结合用户的历史行为和物品信息,得到每种行为下的用户偏好数据。

2)先进的数据建模方法产出有效标签和合理权重

合并用户各种行为的偏好数据,得到用户在物品、品牌、类别、标签等各个维度上的偏好程度。

3)行之有效的算法输出以进行有理有据的预测

借助机器学习中的分类和聚类算法,经过模型的训练、预测和后处理,有效解决用户群体划分问题。


电商行业解决方案

达观为每位电商用户行为精准建模识别其购买偏好,在此基础上向其个性化推荐商品,从而提高命中用户需求的概率,增加网站交易转化。

 

媒体行业解决方案

智能分发的时代已经到来,精准传播至关重要。达观个性化新闻推荐,有效提升用户粘度和用户点击率,同时避免时效新闻滞后推送的问题。

 

视频直播行业解决方案

达观为风口浪尖的直播行业提供智能文本审核,实时处理不良弹幕信息,并针对直播各个应用场景,全方位适时推荐直播内容,增加平台用户付费转化。

 

金融行业解决方案

金融企业充斥着海量新闻动态、客户咨询评论信息及行为数据,达观数据通过实时技术分析,深度挖掘信息价值,实现用户精准营销。

 

科技行业解决方案

科技行业有大量的文档资料、邮件、材料等,达观机器学习助力企业对信息资料快速理解并提取关键信息,达观搜索帮助员工从海量邮件中高效到达目标内容。

项目资料:

成为VIP投资人即可查看

团队介绍:

成为VIP投资人即可查看

查看BP:

成为VIP投资人即可查看

项目回答

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机