建造者说

总在造着什么的路上

当下数据矿工们谈论最多的,莫过于这「星火」了。Spark这名字,总让我联想起高中背过的单词书,从而印象不佳,哈哈。 今天也凑了把热闹,把一个日志解析的模块改成Spark实现,算是体验之旅吧。

阅读全文 »

工作中难免有遇到MySQL欧巴的时候,奈何我是个记性不大好的人,临笔忘词,只能祭出谷歌大法,于是想着造个小破轮子,优雅地解决Python连接MySQL的问题。

阅读全文 »

近期团队正在做一些环境配置自动化的工作,不得不感叹LibShortText这种C和Python混合、代码结构带着浓浓学术味的依赖库太不标致了。

阅读全文 »

什么是线性分类器? 线性分类器试图通过训练集中的样本得出一个分类超平面,目标是最大程度地区分训练集中不同类别的样本,最终把这个分类超平面应用于新样本的分类。 SVM相比一般的线性分类器有什么不同?

阅读全文 »