以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  [求助]郁闷中!博士课题不知道怎么选?  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=13256)


--  作者:janalee
--  发布时间:1/4/2005 7:38:00 PM

--  [求助]郁闷中!博士课题不知道怎么选?
老板给了个××方向,说是在语义web里面找,看了一大堆本体集成以及利用本体进行查询优化××方面的文章,可是不知道落脚在何处啊!

请大侠们不吝赐教!

多谢多谢!万急万急!

有什么好的资料信息尽管扔给我!
nianweilee@yahoo.com.cn


--  作者:janalee
--  发布时间:1/5/2005 5:00:00 PM

--  
难道坛子里面没有做这个的boshi么?唉!郁闷!

哥几个有什么好建议?help


--  作者:小懒龙
--  发布时间:1/5/2005 6:19:00 PM

--  
和你同样的问题。郁闷很久了。觉得越看越希望渺茫的样子。
--  作者:iamwym
--  发布时间:1/5/2005 11:10:00 PM

--  
愚见,最近semantic web service很热,ontology annotation, versioning都有些新东西做。
--  作者:janalee
--  发布时间:1/6/2005 9:07:00 AM

--  
楼上的能给点详细的说明么?
--  作者:iamwym
--  发布时间:1/6/2005 9:38:00 AM

--  
不妨在google scholar搜索一下那几个名词,另外看看iswc2004的论文,里面的future work会讲了比较详细一写。semantic web service的话,去这个bbs的另外一个版,那里有很多信息,作为新的web service标准,实在很多东西可以做,hoho,说实话说不定我也定这个题。
--  作者:npubird
--  发布时间:1/6/2005 10:15:00 AM

--  
抓住最新的相关会议和权威的杂志,认真、静心下来看资料。
确实,想从里面找个方向是非常难的,况且现在做这方面的人越来越多了,也许自己找到的东西别人已经做了一段时间了,所以,我感觉这种新兴的领域需要抓紧时间。虽然看起来似乎很多东西无从下手,或者感觉国外已经做得差不多了,但我相信专进去的话会发掘出很多有益的问题。

回想自己定方向的历程,也感觉很不容易。博士第一个学期看了近700篇的文献(当然并不都是精读),直到第2个学期才慢慢的确定了方向。
我们一辈子没有多少年,读博士也很不容易,如果能找个好的方向,做出一点小的成绩,那么将来毕业的时候会感到欣慰很多。

方向还是看自己,现在很多新的idea别人不会,也不敢到处乱说的,但是和别人讨论讨论自己的想法还是有益的。

博士论文需要创新,需要专到一个具体的问题点上。因此,继续努力吧,度过了这一关,以后就越来越好走了。


--  作者:mlj12
--  发布时间:1/6/2005 6:19:00 PM

--  
55555555555555,我才本科啊,怎么课题也 OWL方面的了,郁闷啊!!!!!!哪里有资料啊!!!
--  作者:iamwym
--  发布时间:1/6/2005 7:04:00 PM

--  
本科做owl的话,估计做一个能使用的ontology,就可以过关了。
--  作者:whale
--  发布时间:1/6/2005 10:36:00 PM

--  
感觉不要跟着标准走,
自己找些确实可以和身边的应用结合起来的,又能运用现有semantic web技术的应用方向!
--  作者:ChouBill
--  发布时间:1/10/2005 10:07:00 AM

--  我的论文方向,大家多多指教
我今年做博士论文,导师让我选本体方向的题目,我初步定下了这么一个题目——“SWOM网络本体模型及其应用研究”,大家讨论一下看看成不成吧。其实我的核心想法是,做一种本体模型出来,从理论上能解决目前本体存在的客观性和共享性问题,并围绕这个模型构造相应的本体描述语言OWL-SWOM、本体建构方法、本体相似度和相关度算法、本体查询语言SWOM-QL、以及一个本体的应用实例(智能答疑系统,由另一个博士完成,偏重自然语言分析)

SWOM=Sememe-based Web Ontology Modal

Tom Gruber曾经提到过本体表示应该遵循客观性原则。我们认为,如果本体建构是客观的,那么无论谁来建立,其结果都应该是一样的。但事实上不是这样的,在本体建构的过程中有时候很难保证其客观性。让不同人对同一个概念用形式化的方式进行描述,通常每个人都会有自己的描述方式。他们会根据自己的理解和偏好,为同一个概念设置不同的属性、性质甚至概念的上下位关系。本体的客观性问题会直接导致已经建成的本体难以被他人共享使用。这是违背了本体的初衷的,于是人们开始开发一些本体合并和本体集成工具来帮助实现本体的共享。但无论如何,这也只是一种事后补救的方法。另外,概念之间关系的直接标注还可能导致本体扩展起来比较麻烦,因为新增一个概念不仅要增加对这个概念本身的描述,通常还需要修改已经存在的概念以揭示新老概念之间的关系。

SWOM的基本观点认为,义素是表达概念意义的最小单元,一个概念可以由若干个义素来表示,词汇是概念的人类语言载体,一个词汇通常有若干个义项,每个义项可以理解为一个概念。领域义素可以理解为某个领域内不可再分的核心概念,领域概念可以由领域义素来表示。因为在某个领域中概念数>>领域义素数,所以概念和概念之间的可能存在的关系总量要远大于概念和义素之间的关系总量。为了降低概念间关系标注的复杂性,我们不鼓励直接标注概念和概念之间的关系(显性关系),而是尽量只标注概念和义素之间的关系(隐性关系),通过隐性关系的标注让计算机自动推导出概念之间的显性关系。两种方法区别可以由下图体现:


此主题相关图片如下:
按此在新窗口浏览图片

SWOM相对原来的本体直接标注有如下好处:
1、同义、近义甚至上下位等关系可以通过计算得到,而不是直接标注,可以降低人对本体客观性的影响。
2、在某个领域中,核心概念和隐性关系是可以共享使用的,相当一部分显性关系是可以由隐性关系推导出来,如果不够用的话,可以进一步标注显性关系,但不能保证新标注的显性关系的可共享性。
3、可扩展性较好,要在一个已经建好的本体中增加或删除某个概念,可能会对已经建好的其它概念作出很多改动。这不符合对修改封闭、对扩展开放的面向对象思想。采用SWOM模型以后,无论是增加还是删除一个概念,都不需要对其它概念作出改动,因为概念只和义素(核心概念)发生关系。

大家认为如何,请多提提宝贵意见吧,免得到时候不过就惨了


--  作者:npubird
--  发布时间:1/10/2005 4:38:00 PM

--  
以下是引用ChouBill在2005-1-10 10:07:51的发言:
我今年做博士论文,导师让我选本体方向的题目,我初步定下了这么一个题目——“SWOM网络本体模型及其应用研究”,大家讨论一下看看成不成吧。其实我的核心想法是,做一种本体模型出来,从理论上能解决目前本体存在的客观性和共享性问题,并围绕这个模型构造相应的本体描述语言OWL-SWOM、本体建构方法、本体相似度和相关度算法、本体查询语言SWOM-QL、以及一个本体的应用实例(智能答疑系统,由另一个博士完成,偏重自然语言分析)

SWOM=Sememe-based Web Ontology Modal

Tom Gruber曾经提到过本体表示应该遵循客观性原则。我们认为,如果本体建构是客观的,那么无论谁来建立,其结果都应该是一样的。但事实上不是这样的,在本体建构的过程中有时候很难保证其客观性。让不同人对同一个概念用形式化的方式进行描述,通常每个人都会有自己的描述方式。他们会根据自己的理解和偏好,为同一个概念设置不同的属性、性质甚至概念的上下位关系。本体的客观性问题会直接导致已经建成的本体难以被他人共享使用。这是违背了本体的初衷的,于是人们开始开发一些本体合并和本体集成工具来帮助实现本体的共享。但无论如何,这也只是一种事后补救的方法。另外,概念之间关系的直接标注还可能导致本体扩展起来比较麻烦,因为新增一个概念不仅要增加对这个概念本身的描述,通常还需要修改已经存在的概念以揭示新老概念之间的关系。

SWOM的基本观点认为,义素是表达概念意义的最小单元,一个概念可以由若干个义素来表示,词汇是概念的人类语言载体,一个词汇通常有若干个义项,每个义项可以理解为一个概念。领域义素可以理解为某个领域内不可再分的核心概念,领域概念可以由领域义素来表示。因为在某个领域中概念数>>领域义素数,所以概念和概念之间的可能存在的关系总量要远大于概念和义素之间的关系总量。为了降低概念间关系标注的复杂性,我们不鼓励直接标注概念和概念之间的关系(显性关系),而是尽量只标注概念和义素之间的关系(隐性关系),通过隐性关系的标注让计算机自动推导出概念之间的显性关系。两种方法区别可以由下图体现:


此主题相关图片如下:
按此在新窗口浏览图片

SWOM相对原来的本体直接标注有如下好处:
1、同义、近义甚至上下位等关系可以通过计算得到,而不是直接标注,可以降低人对本体客观性的影响。
2、在某个领域中,核心概念和隐性关系是可以共享使用的,相当一部分显性关系是可以由隐性关系推导出来,如果不够用的话,可以进一步标注显性关系,但不能保证新标注的显性关系的可共享性。
3、可扩展性较好,要在一个已经建好的本体中增加或删除某个概念,可能会对已经建好的其它概念作出很多改动。这不符合对修改封闭、对扩展开放的面向对象思想。采用SWOM模型以后,无论是增加还是删除一个概念,都不需要对其它概念作出改动,因为概念只和义素(核心概念)发生关系。

大家认为如何,请多提提宝贵意见吧,免得到时候不过就惨了




感觉思路很不错。
先问个问题:感觉义素是核心。义素如何确定呢?领域专家?领域内制定的标准概念?如果这样的话,是否人的影响(即主观性)还是无法避免呢?

如果不考虑关系,那么把现在的概念进行如下处理:将同义概念中的一个设定为义素,其它的则就通过与该义素的联系来表示;对多义词,可相似进行处理......
这样得到的是义素吗?

简单想了一下,很肤浅,呵呵


--  作者:iamwym
--  发布时间:1/11/2005 5:56:00 AM

--  
个人觉得这个思路不过不太可能的吧,呵呵。
不过我觉得ontology要有一个模型,还确实是比较困难的东西,要是有一个建立的标准倒是很创新的东西,可是问题是能不能建立一个合理的模型了。
现在有一些upper ontology,top ontology的概念,也算是建立Onotology遵守的准则了,不知道有没有重复的情况。
顺便问一下,modal还是model?
一点愚见~
--  作者:ChouBill
--  发布时间:1/11/2005 9:53:00 AM

--  
楼上的两位兄弟提得很好,谢谢。

核心概念的 确定 的确 是 这个思路的一个关键点,我还没有深入研究应该怎么去确定,但我觉得核心概念应该是领域概念中的一个最小集合,用它可以表达领域中的所有其它概念就可以。这里一个现实的例子是知网,他们用800个左右的义原就可以表示4万多条词汇。义素的确定当然需要依靠领域专家,但我觉得按照上面的大原则,无论是谁来做,无论采用什么方法,最终确定的义素总是会不断趋于相同。

iamwym能告诉我为什么你觉得这个思路不太可能吗?

upper ontology和top ontology好像还不是义素的概念,我理解他们是指比普通本体更加抽象的、通用程度较高的上层本体,例如时间、事件等。义素不比普通概念更加抽象,它只是一个领域内的核心概念集 。

应该是model,谢谢。


--  作者:iamwym
--  发布时间:1/11/2005 6:25:00 PM

--  
upper ontology只是一种可能潜在的模型,你所提到义素,用英语怎么表示?
我有点理解你要做什么了,那这样建立的模型,是在一个领域内的规范化概念和名词咯?这样看起来是完全可行的,似乎有点像编程当中用到的库函数,呵呵。
我是觉得工作量似乎有点大,如果你要定义整一个域内的概念。而提出一个规范化的标准工作量少些,但是难度也就大了。
--  作者:ChouBill
--  发布时间:1/12/2005 9:36:00 AM

--  
义素=sememe,比如皇帝emperor可以用human(人),occupation(职位),royal(皇)等核心概念来表示。

工作量的确不小,而且要进行自然语言分析,可能这个本体库中不仅要有名词,还需要有动词、形容词等,如动词的配价信息、语义范畴,形容词的配价语义范畴等等。当然,对于博士论文来说我觉得只需要找一个领域做实验即可,并且动词形容词也只选用一些常见的。


--  作者:whale
--  发布时间:1/12/2005 10:56:00 AM

--  
都是做语义核心技术的,俺们只能搞应用层面了!
--  作者:iamwym
--  发布时间:1/13/2005 1:12:00 AM

--  
sememe是linguistic上面的东东吧,自然语言处理方面我没什么发言权,不过这样看起来还是通过没问题的,加油咯。
--  作者:yangliu
--  发布时间:1/14/2005 4:36:00 PM

--  想法很好!
我也许明白了你的想法,你是想从一个外在的角度来表述Ontology中的概念,
从而隐式的规定ontology中的其他要素。


而Ontology的现状是用概念之间的上下位关系之类的简单办法来加以刻画。
在这种现状之下,ontology是独立的,它几乎不需要依附于任何固有的东西。
所以我们可以对某个Ontology赋予各种解释。
也许你的方案可以通过对于义素的不同解释来达到类似的效果。

从另一个角度来看,根据你所描述的内容,你预期的系统的描述能力要比
现有的Ontology的描述能力高得多。而Ontology是要在描述能力和推理计算能力
之间做一个权衡的(两者是一对矛盾)。所以我建议你在做之前,
注意到Ontology的目标。

欢迎和我讨论
我的电子邮件是:yangliu@ustc.edu


--  作者:ChouBill
--  发布时间:1/17/2005 10:33:00 AM

--  
to yangliu:

    谢谢你的意见。其实我的预期描述能力并不比原来的方式更高,我想改进的主要是本体描述的客观性,客观性提高了那么本体的共享性问题自然可以得到提高。本体之所以存在的根本原因在于本体能促进知识共享,人们不必每次都从头开发知识库。目前很多单位都在做本体,但做出的本体很少有直接拿出去就能被别人共享使用的,原因领域中的概念、关系、性质、公理实在太多太复杂,不同单位不太可能达成共识。那么我的想法就是只取某个领域中的具有原始意义的最基本的核心概念、关系和公理,那么这些核心概念达成共识的可能性就会提高很多。

    这个模型的推理能力应该不会比原来的方式差,但推理时的计算性能确实是一个问题。但我认为计算性能可以通过改进本体查询和推理的接口得到解决。因为我们人工标注的是隐性关系(概念—义素关系),我们查询和推理需要的是显性关系(概念-概念关系),那么我们可以在标注隐性关系的同时让本体服务器预先推理出显性关系来并且加以缓存,这样我们在利用本体服务器查询和推理时仍然是利用显性关系来进行,这和原来没有什么两样,只不过在共享时共享的是隐性关系,更有利于共享。

    上面是我不成熟的见解,还望讨论提高。


--  作者:abigsmile
--  发布时间:4/3/2005 9:23:00 PM

--  
我也是本科的要做标注 annotation方面的东西。。。
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
108.887ms