Advertisement

R语言入门: %>%

阅读量:

本期重点讲解上次预告的中缀函数%>%>该函数位于dplyr包内部封装,并展示了其独特功能与应用价值。此外,在下期节目里会为大家剧透一些相关知识:有同学提出希望学习reshape2包中的 melt() 函数以及 cast() 函数的具体用法与应用场景。

函数介绍(3)

%>%

%>.%>这个符号在编程中被广泛使用作管道符。
举个例子来说,在R语言中,
%>%的作用非常显著在于:它能够将前一操作的结果传递给后一操作作为第一个参数。
具体来说,
%>%符号的功能非常强大在于:它能够将前一操作的结果传递给后一操作作为第一个参数。
举个例子来说,
在R语言中,
%>%的作用非常显著在于:它能够将前一操作的结果传递给后一操作作为第一个参数。
举个例子来说,
在R语言中,
%>%符号的作用类似于一种连接器,
实现了将前一个运算结果传递到下一个运算过程。
举个例子来说,
在绝大多数情况下,默认接受的数据类型都是向量或矩阵等结构化数据类型。
通过这种机制,
我们可以直观且易于理解地呈现数据处理的整体流程以及各步骤之间的相互作用关系。

话不多书,我们看实例吧!

% >%的常见用法

本期仍然以我们非常熟悉的"mtcars"数据集作为示例来进行展示。

该数据集呈现如下形式,在每一行中都代表一种汽车型号,并包含以下变量:mpg(英里每加仑)、cyl(气缸数)、hp(马力)、drat(后轮转速比)、wt(重量)、qsec(¼英里加速时间)、vs(顶盖类型)、am( transmission类型)、gear( gear ratio)和 carb( 涡轮数量)。

那么,在这些车型中希望找出车辆气缸数设置为4或6,并且每消耗一加仑汽油行驶里程小于25英里以及重量低于3吨的所有车型,在传统情况下应该如何执行获取特定数据集的操作流程呢?

显而易见地,在反复向which()函数中加入各种筛选条件后, 我最终调试完成了一段自定义的数据提取脚本. 然而对于大多数人来说, 这段代码的整体可读性较差, 要深入理解其中的工作原理和逻辑关系, 则需要付出极大的努力. 下面我们可以借助管道运算符%>%来提升这段代码的质量.

通过使用子集函数subset()的持续传递机制,在分析过程中我们可以直观地识别出数据筛选的具体标准,并允许我们精确调整这些设置。

注:该函数采用data作为输入,并根据formula进行筛选。其中data代表输入的数据集,formula用于指定筛选条件。通过管道符连接的方式,前一个操作的输出结果会被传递给后一个操作作为其第一个参数的数据。

不仅在数据清理方面,管道符也可直接用于将数据输入至绘图、运算等各类函数中,展现出极高的灵活性。

注:该函数可指定数据集中应保留哪些变量;其参数包括data和variable。

全部评论 (0)

还没有任何评论哟~