上述数据表示某问卷中五个问题的(q1q2,…,q5)的答案。 首先,选取数据集中的一些列。 照例使用 Symbol 指定列:

    1. select(responses(), :id, :q1)
    idq1
    128
    261

    也可以使用字符串:

    1. select(responses(), "id", "q1", "q2")
    idq1q2
    128us
    261fr

    如果要选取除了 某些列外的所有列,请使用 Not

    也适用于多列:

      idq1q2q3
      128usF
      261frB
      1. select(responses(), :q5, Not(:id))
      q5q1q2q3q4
      A28usFB
      E61frBC

      注意,q5select 返回的 DataFrame 的第一列。 要实现如上的操作,更聪明的做法是使用 :。 冒号 : 可以认为是 前述条件尚未包含的所有列。 例如:

      或者,把 q5 放在第二个位置16

      1. select(responses(), 1, :q5, :)
      idq5q1q2q3q4
      1A28usFB
      2E61frBC

      甚至可以使用 select 重命名列,语法是 source => target

        participantagenationality
        128us
        261fr

        另外,还可以使用 “splat” 算符 ... (请查阅 Section ) 写作如下形式: