sociosemanticとは。

このwikiによると、sociosemanticとは:

"A sociosemantic web consists of semantic links whose meanings are negotiated, like tag or category systems in peer to peer negotiated meaning webs like Wikipedia. Unlike semantic web ideology no single arbiter decides which link types or directives are legitimate, these are considered factionally-defined terms."

と定義されている。

socioというルートは

"the root "socio" comes from the Latin root socius: companion, partner, friend, comrade, colleague, ally, from which English derives the words social, asocial, society, etc."

引用元

"semantics is the study of meaning" - Wikipedia

参考になるPDFファイル - Moving from bytes to words to semantics

セマンティックウェブは何年もまえから言われていますが、なかなか大規模実装的なものがある気がしません。もちろん、検索エンジン各社、実装に励んでると思いますが。

バイオインフォマティックスに応用もされているようですので、興味深いです。

この前ワードソートのプログラムのサンプルをJavaで作ったが、WikipeidaのSemanticsの最初のパラグラフを使ってみた。下記が出力です。

"semantics" : 1
(from : 1
(meaningful) : 1
(without : 1
Further : 1
Greek : 1
In : 4
It : 2
Linguistic : 1
Other : 1
Semantics : 2
The : 3
This : 1
Within : 1
a : 6
agents : 1
also : 1
although : 1
and : 11
are : 1
as : 3
been : 1
between : 2
body : 1
branches : 1
by : 2
called : 1
circumstances : 1
combinatorics : 1
comes : 1
communication, : 1
communities : 1
complex. : 1
connotation. : 1
content, : 1
content.[3] : 1
content; : 1
contexts.[3] : 1
contrasts : 1
denotata. : 1
denote : 1
denotes : 1
down : 1
each : 1
etymology : 1
express : 1
expressions, : 1
facial : 1
field : 2
fields : 2
fields. : 1
focuses : 1
for, : 1
formal : 5
forms : 2
from : 1
has : 2
have : 2
highly : 1
humans : 1
ideas, : 1
in : 4
include : 2
including : 1
inquiries, : 1
inquiry, : 1
international : 1
interpretation : 1
intersects : 1
is : 9
it : 1
its : 1
itself : 1
language : 2
language, : 5
language. : 1
language.[5] : 1
languages, : 1
lexicology, : 1
linguistics, : 1
logics, : 1
long : 1
many : 2
meaning : 1
meaning), : 1
meaning, : 1
meaning. : 1
most : 1
neuter : 1
notably : 1
of : 25
often : 2
on : 1
or : 3
ordinary : 1
other : 3
others, : 1
over : 1
own : 1
paragraph : 1
particular : 1
period : 1
philology, : 1
philosophy : 1
phrases, : 1
plural : 1
popular : 1
pragmatics, : 2
problem : 2
programming : 1
properties.[4] : 1
proxemics : 1
punctuation : 1
range : 1
reference : 2
related : 2
relation : 1
relationships : 1
right, : 1
s?mantika, : 1
s?mantikos)[1][2] : 1
scientific : 1
selection : 1
semantic : 3
semantics : 8
semantics. : 1
semasiology. : 1
semiotics. : 2
several : 1
signifiers, : 1
signs : 2
sounds, : 1
stand : 1
structure : 1
study : 7
study. : 1
subject : 1
such : 2
symbols : 2
symbols, : 1
syntax, : 2
synthetic : 1
technical. : 1
that : 2
the : 16
their : 3
themselves : 1
there : 1
therefore : 1
they : 1
things : 1
this : 1
through : 1
time, : 1
to : 5
understanding : 2
units : 1
used : 3
users : 1
view, : 1
vocabulary : 1
well-defined : 1
what : 1
with : 3
within : 1
word : 2
words, : 1
written : 1

これであるTFが分かりますよね。これで応用できることがいっぱいありそうな気が。

プログラムを少し変えてExcelでカウント順にした後、トップ5のよく使われた単語は以下です。

of	25
the	16
and	11
is	9
semantics	8

ちょうど良く、semanticsが5番目に出ています。なので、ストップワードをのぞいたら、トピックのsemanticsが出てきたという感じでしょうか。