博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark机器学习(一) -- Machine Learning Library (MLlib)
阅读量:7050 次
发布时间:2019-06-28

本文共 1495 字,大约阅读时间需要 4 分钟。

  hot3.png

MLlib is Spark’s machine learning (ML) library. Its goal is to make practical machine learning scalable and easy. It consists of common learning algorithms and utilities, including classification, regression, clustering, collaborative filtering, dimensionality reduction, as well as lower-level optimization primitives and higher-level pipeline APIs.

MLlib是Spark机器学习库。它的目标是构造实用的、可扩展的、简单的机器学习。它的通用组成部分分为学习算法和工具包,包括:分类、回归、聚集、协同过滤、降维,也提供了lower-level级别的原型优化和higher-level级别的pipeline API。

It divides into two packages:

  •  contains the original API built on top of .

  •  provides higher-level API built on top of  for constructing ML pipelines.

它分为两个包:

  •  :包括构建在 之上的原型API。

  •  :提供构建在  上的 higher-level API ,而 是为了构造ML管道的。

Using spark.ml is recommended because with DataFrames the API is more versatile and flexible. But we will keep supporting spark.mllib along with the development of spark.ml. Users should be comfortable using spark.mllib features and expect more features coming. Developers should contribute new algorithms to spark.ml if they fit the ML pipeline concept well, e.g., feature extractors and transformers.

推荐使用 spark.ml ,因为基于DataFrames的API 更加通用和灵活。但是我们将继续支持spark.mllib 和spark.ml一起发展。用户可以舒畅的使用spark.mllib特性,并且期望更多特色的到来。开发人员安装了可以贡献新的算法给spark.ml,当然这些算法应与ML pipeline概念相适应。

e.g:extractors(提取器) 和 transformers(转换器)

We list major functionality from both below, with links to detailed guides.

我们在下面列出了主要的功能,通过连接进入详细指南。

spark.mllib: data types, algorithms, utilities

转载于:https://my.oschina.net/snug/blog/664779

你可能感兴趣的文章
LeetCode--205--同构字符串
查看>>
python-ConfigParser模块【读写配置文件】
查看>>
wireshark使用方法总结
查看>>
Window Server 2008 R2 TFS2010 安装前的准备
查看>>
20141123
查看>>
translucent 属性
查看>>
android listView嵌套gridview的使用心得
查看>>
[ES7] Descorator: evaluated & call order
查看>>
安卓动态调试七种武器之离别钩 – Hooking(上)
查看>>
从P6 EPPM 8 R3 到P6 EPPM 16 R1 有哪些改变?
查看>>
Android Studio2.0 教程从入门到精通Windows版 - 安装篇
查看>>
Linux 系统磁盘满处理方法
查看>>
Java HashMap Demo
查看>>
yaml官方介绍
查看>>
three.js模型
查看>>
网络流24题 餐巾计划问题
查看>>
基于 Android NDK 的学习之旅-----序言
查看>>
InnoDB recovery过程解析
查看>>
鼓浪屿
查看>>
alloc_skb申请函数分析
查看>>