dplyr专注处理dataframe对象, 并提供更稳健的与其它数据库对象间的接口。
一、5个关键的数据处理函数:
select() 返回列的子集
filter() 返回行的子集
arrange() 根据一个或多个变量对行排序。
mutate() 使用已有数据创建新的列
summarise() 对各个群组汇总计算并返回一维结果。
Tips:
1、select()
Dplyr包有下列辅助函数,用于在select()中选择变量:
starts_with("X"): 以 "X"开头的变量名
ends_with("X"): 以 "X"结束的变量名
contains("X"): 包含 "X"的变量名
matches("X"): 匹配正则表达式“x"的变量名
num_range("x", 1:5): 变量名为 x01, x02, x03, x04 and x05
one_of(x): 出现在字符向量x中的所有变量名
在select()中直接使用列时不需要引用"",但使用上述辅助函数时必须引用""。
2、filter()
R 有一系列逻辑表达式可用于filter()中:
x < y;x <= y;x == y;x != y;x >= y;x > y;x %in% c(a, b, c)
示例:
filter(df, a > 0, b > 0)
filter(df, !is.na(x))
3、arrange()
arrange()默认从小到大排序,在arrange()中使用desc()作用于变量可以使之从大到小排序.
4、mutate()
mutate()允许在同一次调用中使用新变量来创建下一个变量,例如:
mutate(my_df, x = a + b, y = x + c)
5、 summarise()
R的下列聚合函数可用于 summarise()中
dplyr包自身提供了一些有用的聚合函数:
. 孩子吃奶粉后肠胃不好是什么原因,为什么会出现孩子吃奶粉后肠胃不好的情况,孩子吃奶粉后肠胃不好的原因是什么呢,为什么孩子会出现这种情况呢,友谊长存小编跟大家具体的说说。 放水和奶粉的顺序 正确...
相信各人也都是明晰着一点,那就是如今的创业加盟行业傍边,除了饮品行业以外,汉堡这一行业的投资也是相当的少,利润?却是差不多的高,而汉堡这一行业呢?单单与饮品行业对比的话,成长前景还要再大一些,跟着人们...
小儿脓毒症可能很多人都没有听说过,但是听说过的人又超级怕自己的孩子得这种病,那么这个病是什么病呢,孩子得小儿脓毒症可怕吗,友谊长存小编就来说说吧。 脓毒症、脓毒性休克到底有多可怕? 脓毒症是目前导...
1、首先,打开微信登录的界面,再点击右上角外带圈的加号按钮,在弹出的下拉菜单中点击添加朋友。2、然后,在添加朋友。 怎么查询微信已删除聊天记录? 微信备份的聊天记录怎么查看?随着时代的进步,大家更换新...
丁克是什么意思,丁克族是极度自私的人,现在不少年轻人表达不想生孩子。 有些是暂时条件不具备,有些则宣称要做个“丁克族”。 丁克是“DINK”的音译,英文DOUBLEINCOME N...
我们经常能在朋友圈或者是出门遛弯时,看到狗狗们被它们主人打扮得非常光鲜靓丽,小鞋子小衣服帽子等都非常齐全。那么问题就来了,狗狗真的需要穿衣服吗?所有狗都适合穿衣服吗?给狗狗穿衣服有什么好处或者坏处呢?...