已收藏 收藏
4232
微信分享
视频列表

圆桌讨论

王永雄
4794

中产阶级如何利用量化投资工具完成财富进阶

邓一硕
5547

统计转移学习(及其在统计过程控制的应用)

宗福季
7823

大数据时代下的统计学思维—以文本挖掘为例

郭建华
5010

Building Better Connected World with Artificial Intelligence Tec

李航
4747

Statistical learning with genomic big-data

刘军
4728

Data Science, machine learning, precision medicine, and all that

王永雄
5541

Adaptive False Discovery Rate regression with application in int

杨灿
3893

条件随机场及其在生物信息学中的应用

吴凌云
5130

Glimma: getting greater graphics for your genes

Charity Law
5532

Rsubread: an efficient toolkit for mapping and counting short se

Yang Liao
4347

汽车消费的数字化决策

张翔
4122

机器学习在滴滴

王犇
9066

摩拜单车的数据科学实践

朱俊辉
5127

A smooth simultaneous confidence band for correlation curve

张园园
4396

Simultaneous conficence bands for mean and variance function bas

蔡利
3755

Prediction Interval for Autoregressive Time Series via Oracally

顾莉洁
4595

On a vector double autoregressive model

张兴发
3730

Banded Spatio-Temporal Autoregressions with with Application to

马莹莹
4841

基于车辆GPS 数据的交通大数据应用

金雯
6272

Branding with social media: User gratifications, usage patterns,

皋琴
6841

质保数据建模与分析

何曙光
5203

卓越质量管理中的大数据分析

王凯波
6258

PM 2.5 数据的时空特征及统计建模

朱雪宁
5062

不可或缺的优质地理大数据

高楠
3862

基于室内定位数据(IPS)的时空行为分析

黄蔚欣
7888

地理数据与商业网点选址实战

张志成
4089

Identification of disease-causing single nucleotide variants in

江瑞
3908

癌症转录组大数据的可视化与再挖掘

唐泽方
4982

消化道肿瘤基因组学研究进展

吴健民
4894

临床医生眼中的医疗大数据研究:需求和挑战

周健
3633

R Usage in Pharmaceutical Industry

Harry Hua
4143

手机数据与经济活动测度

董磊
4093

词汇、概念、数字:文本探勘技术于中国近代观念史研究中的应用与实践

邱伟云
4435

群像的描绘与类型的分析:用数字工具挖掘《德意志人物志》

王涛
4613

network diffusion: Simulate and Visualize Network Diffusion

秦强
3920

计算与人文:作为新领域的“数字人文”

陈静
3883

Elastic Stack 与机器学习

曾勇
6562

Evaluating Fast Algorithms for Convolutional Neural Networks on

卢丽强
8125

Pluto: A Distributed Heterogeneous Deep Learning Framework

王思宇
6506

Exploring Heterogeneous Algorithms for Accelerating Deep Convolu

肖倾城
5650

嵌入式上的深度学习初探

张先轶
5627

再抽样法分析夫妻般配与家庭工资不平等

李代
4235

法律的定量分析及其实践

邵兴全
4603

Latent Variable Modeling for Cognitive Assessment Through Second

刘京辰
5248

中文文本分析方便工具包chinese.misc介绍

吴江
4233

大数据教育平台的建设与探索

袁星星
5000

大数据教育学科建设的关键因素

王涛
3978

微启的旋转门:大数据教育界与工业界的生态进化

赵鹏
4055

跟踪 R 社区动态 - R Weekly 的背后

覃文锋
4073

Learning R Internals and C++ via Rcpp

任乾
4022

Persistent Reproducible Reporting with Docker and R

肖楠
4234

利用css对shiny页面优化及利用htmlwidgets包创建HTML控件

谢佳标
6099

SAS统计图表:一键式的图表生成术

谷鸿秋
5193

Interaction+: “让可视化动起来”的既有网页交互

陆旻
4100

数控机床大数据分析

田野
5196

人工智能颠覆客服行业的实践

刘应耀
6047

机器学习在营销管理中的应用

吴岸城
4393

从统计学生到互金数据科学家之路

徐旦
5442

“AI+慢性病管理”使精准医疗成为可能

金博
3864

心理学在助老机器人研发中的应用

余嘉元
3863

心理学研究规范化及在R语言的实现

蔡培林
4375

R语言在加强心理学可重复性中的作用

胡传鹏
5492

基于R与Rstudio的心理统计教学模式探索

吕小康
4836

基于社会媒体大数据的心理学研究

朱廷劭
4133

NLP在金融报告自动化的实践

吴珂皓
6963

面向社交媒体的商业大数据挖掘

赵鑫
4474

自然语言处理在医疗智能辅助中的应用

张超
5653

智能时代的量化资产管理

郑亚斌
4469

从语言智能到法务智能

吕正东
5473

bandit算法与推荐系统

陈开江
5763

腾讯社交广告实践中智能出价新模式:oCPA

王流斌
6247

Learning theory for deep nets

林绍波
4806

Triple Generative Adversarial Networks

朱军
7848

Kaggle 数据挖掘比赛经验分享

陈成龙
9015

On equivalence of likelihood maximization of stochastic block mo

张忠元
3966

从文本分析看小说中人物的复杂关系:以琅琊榜为例

周静
6064

R语言中的深度学习: 用Mxnet进行车型识别

郎大为
5653

条件GAN用于车型设计和判别

张翔
5087

增强学习打麻将

陈昱
10269
视频介绍
课程资料
评价

嘉宾介绍

主题介绍

尽管现在文本挖掘技术发展迅速,各种新技术和新工具不断出现,但用R语言进行中文文本分析的人,特别是初学者,还时常在如何读取文件并避免乱码、如何分词、如何统计词频这样的问题上遇到困难。chinese.misc包尝试缓解这一问题。该R包的功能非常实用,主要用于对中文文本进行数据清理工作,此外还包含另外一些常用的处理和分析功能。在生成文档-词语矩阵的功能上,可以代替对中文不是太支持的tm包。此外,在读取文件、去除停用词、描述性分析等方面,该包在封装既有函数的基础上提供了更为方便和灵活的形式。
未上传任何附件
说点什么

—— 点击加载更多 ——

收起

为你推荐
啊哦,暂无相关推荐