滴水穿石博客是某铲屎官用来记录学习笔记的小站(微博@Shawn有点困惑),可能有以下特点:

  • 欢迎讨论
  • 原创为主
  • 有理解不对的地方,请不吝指正
  • 不定期更新(但会push自己尽量保持笔记习惯)

给自己安排接下来很想学习的几个点,写下来给自己一些压力:

  1. RBM、MOE、POE和深度学习DBM(待思考)
  2. 搜索引擎相关。(完成度1/2; 还有一本博士论文待看)
  3. 改写,ibm model;(怎么推导,怎么实现)
  4. 卡方校验 vs TF-IDF;(这二者的区别)
  5. 无监督分词+ EM算法(算法待实现)
  6. 进一步理解LDA
  7. 非负矩阵分解(怎么设计loss,如何训练和优化,需实现)
  8. 高斯过程(怎么推导,用在什么场景,怎么优化)
  9. randomwalk / pagerank 算法怎么训练
  10. paragraph vector

PS.如果对百度系产品任何意见或建议,可以发本人邮箱xqiugen@163.com,愿意代为转达