2012年语义网相关领域新成立的公司

在CrunchBase上做了一个搜索 http://www.crunchbase.com/search/advanced/companies/1869976 (结果中有些和语义网无关的,过滤了)

有这么一些2012年成立的,和语义网切实有关的公司

  • Meronymy:高性能SPARQL数据库,创始人Inge Henriksen
  • Silk:数据质量提升,结构化数据
  • Comenta.TV: 用本体做电视内容导航。BTW, 这个Google也在做,NoTube结束后Dan Brickley就去了Google
  • SindiceTech:这个不是新产品了,DERI的好东西,RDF数据存储和检索
  • SpazioDati: 数据集成与curation
  • Modusly: 又一个用语义技术的客户关系管理CRM公司
  • SQMOS: 客户建模,做移动平台上的精准广告投放

当然,这肯定是一个不完全统计。单是在SemTech 2012上出场的几家公司就没有被包括进去。总的来说,语义网领域的创业还在早期阶段,不过重点已经从早年的提供工具为主转向为具体的问题域提供解决方案。这是个可喜的变化。

read more

转移博客到自己的主机

从2011年3月起,“语义噪声”就托管在Wordpress.com。对它的服务很满意,不过为了更大的自由度,决定把这个博客转移到我自己在Amazon EC2的主机上。

转移后有这样几个好处

  • 可以安装任意插件(plugins)
  • 可以和其他的组建更好地合作。比如现在的搜索是基于Elastic Search
  • 更好的中文环境支持,如Denglu评论
  • 数据自由度更好,比如视频,不需要先上传到Youtube上了
  • 数据更安全些

原来的域名blog.baojie.org不变。原博客baojiebaojie.wordpress.com会保留一段时间再关了

P.S. 2012-01-06 Elastic Search的分词有问题,默认把每一个汉字都作为一个词。换为paoding分词系统,加上自己的词典就好了。我用了medcl的ES RTF (ready to fly) https://github.com/medcl/elasticsearch-rtf/

read more

小可人儿妞妞

妞妞快三岁了。近期一些言论如下

1) 妞:爸爸你还没下班吗?你快回来吧,我想你抱我

2) 妞:爸爸给你吃

爸:为什么啊

妞:因为我喜欢你啊。我们是好朋友

3)妞(看电视):我不要老鼠(摆手),我要黑猫警长。黑猫警长是我的好朋友

4)妞:丫丫妹妹不要哭,姐姐帮你找牙齿

5)妞:我要吃棒棒糖!

妈:好,但只能吃一下。吃多了牙齿会长黑虫

妞(舔了几分钟):好了,我吃好了,你给我没收了吧

read more

关于Graph Database

2012年4月到12月间一些关于Graph Database微博的汇总

http://www.weibo.com/xiguadawanzitang/profile?is_tag=1&tag_name=GraphDB

OWL推理一个思路是通过hypertableau,做模型构造。另一个思路是作为图论问题,通过图的构造,最大化可并行性任务(如“或”)。在推理任务的另一端,简单如 semantic wiki的推理,我们也发现推理的所有任务都可以归结到图的路径计算。http://t.cn/zjVMZsw 用图数据库做语义网的数据平台是很自然的

read more