近日,github出炉报告,统计了2018年最受欢迎的编程语言、使用最广的软件包和贡献者最多的热门项目top10。python、numpy和tensorflow分别位列第一,可谓众望所归。c++、java、pandas、scikit-learn等热门语言、库和项目均进入top10。
在我们2018年的octoverse报告中,机器学习和数据科学成为github上的热门话题。 tensorflow是贡献最大的项目之一,pytorch 是增长最快的项目之一,python是github上第三大最受欢迎的语言。我们决定在github上继续深入研究机器学习和数据科学的现状。
我们抓取了2018年1月1日到2018年12月31日之间的贡献数据。这里的贡献可能包括推送代码、提出问题或提取请求,评论问题或提取请求,或审查提取请求。对于大多数导入包,我们使用了依赖关系图中的数据,其中包括所有公共存储库和已选择加入依赖关系图的全部私有存储库。
最受欢迎的机器学习编程语言:python居首
2018年github上最受欢迎的机器学习语言
我们查看了使用“机器学习”主题标记的存储库的贡献者,并对存储库中最常见的主要语言进行了排名。python是机器学习资源库中最常用的语言,也是github上第三常用的语言。然而,并非所有机器学习项目都使用python:github上的一些最常见的语言也是机器学习项目的通用语言。
c ++,javascript,java,c#,shell和typescript等语言都位列github上最常使用的语言前10名,它们也位列机器学习项目最常用语言的前10名。
julia、r和scala等语言也位列机器学习项目的前10名,但没有进入整个github使用语言的前十。 julia和r都是数据科学家常用的语言,而scala在与apache spark等语言在大数据系统交互下的应用越来越普遍。
使用最广泛的机器学习和数据科学软件包:numpy第一
2018年导入github资源库的顶级软件包
我们从依赖图中提取数据,计算出导入流行python包的机器学习或数据科学主题的项目百分比。上面的列表显示了这些项目导入的前十个包。结果如下图所示:
numpy是一个支持多维数据数学运算的软件包,是被导入次数最多的包,被用于近四分之三的机器学习和数据科学项目中。
scipy是一个用于科学计算的软件包,pandas是一个用于管理数据集的软件包,matplotlib是一个可视化库,这三个包被用于超过40%的机器学习和数据科学项目中。
scikit-learn是一种非常流行的机器学习包,包含大量机器学习算法实现,近40%的项目使用它。
tensorflow是一种用于处理神经网络的软件包,有近四分之一的软件包使用它。
前十名中的其他包都是功能性程序包:其中六个是python 2和3兼容性库,python-dateutil和pytz是用于处理日期的包。
最受欢迎的机器学习项目:tensorflow折桂
2018年github上的顶级机器学习项目
我们还考察了2018年“机器学习”标签下贡献者最多的开源项目。tensorflow是迄今为止最受欢迎的项目,是排名第二的scikit-learn的贡献者数量的5倍多。
explosion/spacy和rasahq /rasa_nlu这两个项目专注于自然语言处理问题。
另外四个项目,cmu-perceptual-computing-lab / openpose,thtrieu / darkflow,ageitgey / face_recognition和tesseract-ocr / tesseract,专注于图像处理。 julia语言源代码项目也是2018年贡献者最多的项目之一。
AOPU手机开山之作AOPU 6656将正式亮相
基于STM32设计的掌上游戏机详细开发过程
光敏电阻的工作原理
医疗平板设计需要因地制宜,满足用户的特定需求
2019年手机摄像头最流行哪些要素
Github2018年最热语言\软件包\项目top 10盘点
清源科技多个分布式光伏项目成功并网
埃科光电闯关过会!7成收入来自工业相机,募资11.19亿扩大工业影像核心部件生产规模
泰克示波器在USB2.0一致性测试的应用
2019年需要关注的5种人工智能趋势
如何测试最大输出电流?纳米软件带你了解
硅谷风险投资人看好VR 成为主流技术势在必得
多地“拉闸限电”,隐藏着三大原因
盘点联建光电等企业在Mini LED领域的成果
瑞萨电子强化全球采购体系,重点强化大陆业务
STM32F429的USB工程CAN通讯不正常经验分享
一文解析桥式整流电路
新汉完整数字告示解决方案
电动车频“起火”!蔚来、宁德相互“甩锅”,已引起政府部门关注
芯讯通携摩摩哒共享按摩椅精彩亮相MWCA