about
滴水穿石博客是某铲屎官用来记录学习笔记的小站(微博@Shawn有点困惑),可能有以下特点:
- 欢迎讨论
- 原创为主
- 有理解不对的地方,请不吝指正
- 不定期更新(但会push自己尽量保持笔记习惯)
给自己安排接下来很想学习的几个点,写下来给自己一些压力:
- RBM、MOE、POE和深度学习DBM(待思考)
- 搜索引擎相关。(完成度1/2; 还有一本博士论文待看)
改写,ibm model;(怎么推导,怎么实现)卡方校验 vs TF-IDF;(这二者的区别)- 无监督分词+
EM算法(算法待实现) - 进一步理解LDA
- 非负矩阵分解(怎么设计loss,如何训练和优化,需实现)
- 高斯过程(怎么推导,用在什么场景,怎么优化)
- randomwalk / pagerank 算法怎么训练
- paragraph vector
PS.如果对百度系产品任何意见或建议,可以发本人邮箱xqiugen@163.com,愿意代为转达