个性化阅读
专注于IT技术分析

机器学习 第5页

搜索引擎营销(SEM)的数据科学

半瓶木阅读(898)评论(0)赞(0)

本文概述 搜索引擎营销(SEM)和广告系列 商业案例:srcmini 搜寻引擎营销活动的关键字产生 广告生成和文案写作 数据科学和SEM:还有更多发现! 两年来, 作为srcmini的重度用户, 我学到了很多东西。我的主要业务是在线营销, ...

什么是最好的统计编程语言?信息图

半瓶木阅读(891)评论(0)赞(0)

所有编程社区的共同点是, 关于为什么他们选择的编程语言更好, 更高级, 更快, 更高级等诸多争论。在当今的数据科学社区中, 这些讨论似乎无处不在SAS的倡导者, SPSS, R, Python, Julia等在使用最佳统计编程语言的每种在线...

8个有用的Shell数据科学命令

半瓶木阅读(922)评论(0)赞(0)

本文概述 快速笔记 用wc计数 用cat连接文件 用sed修改文件 子集大文件 使用uniq查找重复项 选择带有剪切的列 循环播放 变量 总结 在许多情况下, 你需要快速分析, 修改和处理数量和大小较大的文件。但是, 文件通常是基于文本的逗...

Scikit-Learn教程:棒球分析(2)

半瓶木阅读(912)评论(0)赞(0)

在本教程的第一部分中, 重点是根据球队的统计数据和该季节的其他变量, 确定该联盟赢得MLB球队的比赛次数。 在该项目的第二部分中, 你将测试Scikit-Learn(sklearn)的逻辑回归模型和随机森林模型, 以根据球员的职业统计数据和...

NLP的歌词分析和R的机器学习-srcmini

NLP的歌词分析和R的机器学习

半瓶木阅读(1751)评论(0)赞(0)

本文概述 介绍 数据 数据调理 描述性统计 文字挖掘 总结 这是一个由三部分组成的系列教程的一部分, 在该系列教程中, 你将使用R来执行传奇艺术家Prince的音乐歌词案例研究中的各种分析任务。这三个教程涵盖以下内容: 第一部分:文本挖掘和...

使用R和PhantomJS进行Web爬取

半瓶木阅读(1407)评论(0)赞(0)

本文概述 内容 加载必要的软件包 用R爬取JavaScript生成的数据 总结 当你需要进行网页抓取时, 通常可以使用Hadley Wickham的rvest软件包。该软件包提供了易于使用的开箱即用的解决方案, 以获取生成网页的html代码...

Scikit-Learn教程:Python与机器学习-srcmini

Scikit-Learn教程:Python与机器学习

半瓶木阅读(962)评论(0)赞(0)

srcmini团队很高兴宣布我们的朋友和srcmini用户Tony Yao-Jen Kuo慷慨地将我们的Python机器学习:Scikit-Learn教程翻译成繁体中文! 使用 Python 实现机器学习 机器学习是一门设计如何让演算法能够...

Scikit-Learn教程:棒球分析(1)-srcmini

Scikit-Learn教程:棒球分析(1)

半瓶木阅读(1163)评论(0)赞(0)

本文概述 第1部分:预测美国职业棒球大联盟每个赛季的获胜次数 体育分析和Scikit学习 Python编程语言是数据科学和预测分析的理想选择, 因为它配备了多个软件包, 可满足你大多数数据分析的需求。对于Python中的机器学习, Scik...

使用Scikit-Learn检测虚假新闻

半瓶木阅读(1050)评论(0)赞(0)

本文概述 数据探索 提取训练数据 构建矢量化器分类器 检测所谓的”假新闻”绝非易事。首先, 要定义什么是假新闻-鉴于假新闻现在已成为政治声明。如果可以找到定义或就其达成共识, 则必须收集并正确标记真实和虚假新闻(希望...