如何在线构建共享机器学习模型

近几年,机器学习迎来了前所未有的大爆发,几乎随处可见。今天就来介绍一下如何在线构建共享机器学习模型。
jupyternotebooks是用来建立机器学习模型最常见的环境之一,它是本地开发机器学习的好工具,但也有缺点,它很难在生成代码上共享与协作。
你不得不进行一系列合理设置,非python用户尤甚,包括需要设置python环境,安装jupyter及其依赖项以及可能需要的其他python软件包。
有点麻烦?有的工具可以直接在浏览器中运行开发notebooks中的python代码。本文就将介绍两个这样的工具。
googlecolaboratory
google colaboratory,通常被称为colab,由谷歌开发,允许所有人在浏览器中创建并运行python代码。其内置许多标准机器学习和数据科学库,包括pandas和scikit-learn,还可以安装几乎其他所有python库,以便在每个notebook中使用。
若想访问colab需注册谷歌账户,可免费访问notebook环境和计算资源,包括gpu。
来快速演示一遍:
登录谷歌帐户后,进入谷歌云盘(google drive)并选择新的google colaboratory。
这样就新建了一个空白notebook。
可以通过运行pip freeze 来查看预安装软件包。
如果需要安装尚无法获取的软件包,可以通过运行 pip install package来完成。
导入数据有许多种方法,包括直接从谷歌云盘中加载文件。
那么怎样从本地csv文件导入数据呢?
首先运行此代码。
from google.colab importfilesuploaded = files.upload()
然后就能看到一个按钮,可以从本地系统任意位置选择文件。
现在就可以自由编写代码来创建机器学习模型。
googlecolab notebooks可以通过链接共享,类似于谷歌文档共享,链接接收者可以运行并编辑代码。
kaggle kernels
kagglekernels需要注册账户,但也是完全免费使用。与googlecolab notebooks非常相似,不过其特有优点是可以进行版本控制。
一旦创建好帐户,就可以导航到网站的kernels区域,然后选择新的notebook。
与colab类似,kaggle kernels提供了许多python常用标准库,可以通过使用pip freeze查看。在导入其他库方面也采用了与colab完全相同的方法,安装软件包也如此。
加载数据非常简单。首先,选择文件(file),然后选择添加或上传数据(add orupload data)。
现在会看到一些选项,可以使用kaggle数据集(datasets)、kernel输出文件(kernel output files)或上传到本地csv文件。
前面说到kaggle有内置版本控制,也就是说可以向自己的kernel或其他人的kernel提交更改,并在需要时追踪并恢复到以前的版本,这样有利于协同合作。
笔者经常使用浏览器中的notebooks来展示工作,特别是那些不会使用jupyter notebooks或python的非数据科学家。这两种工具也是了解机器学习和数据科学的好方法,而且不需要大费周折在本地设置python和notebook环境。

基于新型MEMS开关提高SoC测试能力及系统产出
基于短距离无线通信技术实现无线传感网定位系统的应用方案
低功耗长续航的TWS蓝牙耳机芯片春藤5882怎么样?
如何吧垃圾代码进行垃圾分类详细指南说明
可编程逻辑电路设计之时序与功耗分析工具
如何在线构建共享机器学习模型
ADI推出业界首款8通道超声接收器AD9671
苹果或将会放弃Lightning连接器电缆
TensorRT条件用于实现网络子图的条件执行
苹果派与功率转换器效率
目前空调行业整体承压 仍处于小幅度增长势态
英伟达暴跌18% 10年首次最大跌幅所为何事
用于2-Wire总线应用的上升时间加速器电路
防静电神器TVS揭秘(2):参数详解
云计算新的风向标在哪里?
有效延长电池寿命,ADI超低静态电流同步降压调节器
“惯导及组件”自动化测试解决方案
2015~2018年VR装置出货量预估
从四个方面分析云游戏自动音视频测试
人工智能营销系统能带来什么便利