建造者说

总在造着什么的路上

Hadoop开发中需要用到至少不下10个的依赖包,它们相互间的依赖关系比较复杂,不同版本的依赖关系也有所不同,而间接依赖导致的程序错误并不会在运行之前报错,因此确定适合一个版本的依赖包,会耗费相当多的时间。Maven是一个依赖管理和项目构建的工具,它利用惯例组织Java项目的结构,并允许通过简单的配置定义直接依赖,而直接依赖所需的其他依赖则会通过事先定义好的关系列表自动下载,大大节省了开发者本身的工作量。

阅读全文 »

SVM是一种二类分类模型,其求解目标在于确定一个分类的超平面,以最大化特征空间上的间隔。分类超平面的确定只取决于少数的样本信息,这些关键的样本被称之为支持向量Support Vector,这也是SVM–支持向量机名称的由来。

阅读全文 »

  1. 平实。避免俏皮话和过度修饰,用最简洁的语言把事情说清楚。

博主已反悔

  1. 求精。按实施项目的方式写博客,先构建原型,再迭代完善。
  2. 小而全。主题紧抓一个集中的点,但要覆盖这个小点的所有细节。

设计光年求职的职位存储时,选择了MongoDB的Capped Collection。出发点是:

  1. 阿里云最低配的机器只有512MB的内存,职位超4万后搜索的响应极速下降,有必要缩小数据的规模。
  2. 由于招聘职位是时效性很强的信息,定期删除时间较久远的记录是用户能够容忍的。
  3. 虽然TTL索引也能实现记录的自动删除,但之前的项目经验告诉我它的自动删除并不同时释放硬盘空间。
    阅读全文 »

朴素贝叶斯(Naive Bayes Classifier)是一种「天真」的算法(假定所有特征发生概率是独立的),同时也是一种简单有效的常用分类算法。关于它的原理,参见朴素贝叶斯分类器的应用
scikit-learn是一个广泛应用的机器学习Python库,它封装了包括朴素贝叶斯在内的若干基础算法。在这篇博客里,我们希望用朴素贝叶斯实现对短文本(新闻标题)的分类。

阅读全文 »

由衷觉得在人生里,优雅是特别重要的一件事。
现在独自在家也爱煞有介事地沏上一壶功夫茶,恭敬地摆上三个小杯,虔诚地按照工序烫杯、巡城、点兵,全然忘了自己一点都不像潮汕人,曾经最讨厌的就是喝茶。

只因为这很优雅。

优雅不等于循规蹈矩。恰恰相反,优雅应当是活出自己的姿态,独立的品格、思想、见解是优雅不可或缺的一部分。优雅的人,应当是生活的建筑师,他们建造的是美,产出的是真正高品质的东西。

优雅在于自律。定了6点的闹钟,就绝不拖到7点;约定好的赴约,就千万别晚到一分钟;答应今天完成的工作,拖到明天是可耻的。纵使别处的诱惑再多,心中的准绳也不为之所动。

优雅在于细节。工匠会抚摸每个圆角,程序员会对齐每行代码,音乐家会校正每个音符。与产出有关的一切细节都是重要的,不重要只是庸人马虎对待的借口。

优雅在于简单。世上大多数人都在制造复杂,其实只是徒增垃圾。化繁为简才见大师的功力,复杂使人迷惑,而简单又使人乏味。看似无意拿捏的恰到好处,可要一种直指人心的锐利。

由内到外的优雅,倒不像功夫茶,更像打功夫了。

0%