dplyr专注处理dataframe对象, 并提供更稳健的与其它数据库对象间的接口。
一、5个关键的数据处理函数:
select() 返回列的子集
filter() 返回行的子集
arrange() 根据一个或多个变量对行排序。
mutate() 使用已有数据创建新的列
summarise() 对各个群组汇总计算并返回一维结果。
Tips:
1、select()
Dplyr包有下列辅助函数,用于在select()中选择变量:
starts_with("X"): 以 "X"开头的变量名
ends_with("X"): 以 "X"结束的变量名
contains("X"): 包含 "X"的变量名
matches("X"): 匹配正则表达式“x"的变量名
num_range("x", 1:5): 变量名为 x01, x02, x03, x04 and x05
one_of(x): 出现在字符向量x中的所有变量名
在select()中直接使用列时不需要引用"",但使用上述辅助函数时必须引用""。
2、filter()
R 有一系列逻辑表达式可用于filter()中:
x < y;x <= y;x == y;x != y;x >= y;x > y;x %in% c(a, b, c)
示例:
filter(df, a > 0, b > 0)
filter(df, !is.na(x))
3、arrange()
arrange()默认从小到大排序,在arrange()中使用desc()作用于变量可以使之从大到小排序.
4、mutate()
mutate()允许在同一次调用中使用新变量来创建下一个变量,例如:
mutate(my_df, x = a + b, y = x + c)
5、 summarise()
R的下列聚合函数可用于 summarise()中
dplyr包自身提供了一些有用的聚合函数:
狗的每一种完整能力的养成,都是按一定的程序进行训练的。这种程序必须符台先易后难、由简人繁,循序渐进的客观规律。一般来说,狗的能力的培养程序分为三个阶段: 第一阶段,是培养狗对口令建立基本条件反射的阶...
IP追踪技术能够追踪攻击数据包的源头,加上卫星的定位系统进行定位。IP追踪的关键是找到一种有效的方法能够确定出攻击者的真实源IP地址,否则也就无法对攻击。 你必须经过对方同意才可以给对方手机定位的,比...
例如,假如咱们从这个ArrayBuffer的Int8视图获取元素0和1,那么它将给出与Uint16视图中的元素0不同的值,即便它们包括完全相同的位。 在这一年中,咱们发现Sofacy安排好像正在结构层...
洁净室的等级1K,10K,100K,1000K。.表示多少级别,K就是:1000.1K,千级;10K,万级;100K,十万级;1000K次级别洁净就没有了。 洁净度有国际标准就是ISO还有国内标准你说...
本文导读目录: 1、全球第一黑客是谁? 2、怎样防范黑客攻击家庭路由器 3、本人用家里无线网、黑客能查看到我隐私吗 4、中国十大黑客排名是什么?有什么事迹? 5、世界第一黑客,凯文·米...