待学习

  1. pandas里可以用chunksize来批处理
  2. 字符串可以转换成category型来节省内存
  3. vaex
  4. disk.frame和pandas语法一样,可以做比内存还大的数据的处理