Du bist nicht angemeldet.


Lieber Besucher, herzlich willkommen bei: Schwarzes Halle. Falls dies dein erster Besuch auf dieser Seite ist, lies bitte die Hilfe durch. Dort wird dir die Bedienung dieser Seite näher erläutert. Darüber hinaus solltest du dich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutze das Registrierungsformular, um dich zu registrieren oder informiere dich ausführlich über den Registrierungsvorgang. Falls du dich bereits zu einem früheren Zeitpunkt registriert hast, kannst du dich hier anmelden.

1

Samstag, 4. Februar 2006, 14:15

Semantic Web

Da ich nun langsam auf das Ende meiner Diplomarbeit zu gehen, würde ich als Informatiker gerne wissen, ob sich überhaupt normale Leute für neue Konzepte bzw. neue Technologie begeistern lassen. Mir geht es in diesem Thread im speziellen um das Semantic Web.

Also es geht im großen und ganzen, um eine Verbesserung des vorhandenen World Wide Web. Tim Berners-Lee (der Erfinder des WWW) hat eine Vision in der es Computerprogrammen möglich ist, die Bedeutung von Internetseiten zu erfassen. Dadurch könnten z.B. Suchmaschinen viel bessere Ergebnisse liefern als bisher.

Falls es jemanden interessiert, hier ist ein Interview mit Tim Berners-Lee. Dort wird das noch ein bißchen besser erläutert.

Ich würde gerne von euch wissen, ob ihr schon davon was gehört habt.
Was haltet ihr davon?

Ich gebe zu, vor meiner Diplomarbeit hatte ich über das Thema auch noch nichts gewußt.

2

Montag, 6. Februar 2006, 15:08

Ich kenne einige Leute, die an solchen Projekten arbeiten bzw. das getan haben. Die ganze Forschung in dieser Richtung ist, gelinde gesagt, noch in den Kinderschuhen. Aber das liegt natürlich in der Natur der Sache. Mit evolutionären Algorithmen soll es aber schon ein paar interessante Ergebnisse gegeben haben.
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

3

Montag, 6. Februar 2006, 17:44

Zitat

Original von Darth Lommel
Ich kenne einige Leute, die an solchen Projekten arbeiten bzw. das getan haben. Die ganze Forschung in dieser Richtung ist, gelinde gesagt, noch in den Kinderschuhen. Aber das liegt natürlich in der Natur der Sache. Mit evolutionären Algorithmen soll es aber schon ein paar interessante Ergebnisse gegeben haben.


Ich freu, mich ja erstmal das es überhaupt einen interessiert. :-D

Ja, das Thema ist relativ neu. Ein paar wichtig technologische Bestandteile sind erst 2004 als Empfehlung vom W3C freigegeben worden und der vielleicht wichtigste Teil XHTML2 ist immernoch ein Arbeitsentwurf. Aber mir ging es vorerst um die Sache an sich, um adäquate Wissenrepräsentation und die gibt schon länger in der KI.

Ich bring hier mal ein Beispiel, das Jaguar-Problem. Jemand möchte etwas das Tier den Jaguar erfahren und gibt naiv wir er ist das Wort Jaguar in einer Suchmaschine ein. Natürlich findet er neben Seite über Tiere auch Seite von Autohändler usw. Das Problem beruht darauf das eine Suchmaschine immer nach der Syntax eines Wortes arbeitet und nicht nach der Semantik (Bedeutung). Mit Hilfe des Semantic Web soll das Problem der Synonyme und Homonyme so zu sagen umschifft werden.

Äh sorry Lommel, wie kommst Du denn auf evolutionäre Algorithmen? *amkopfkratz*

4

Montag, 6. Februar 2006, 18:01

Das hab ich irgendwo mal gehört. Als Beispiel zum Jaguar. Das Wort allein ist uneindeutig, man kann höchstens sagen, was wahrscheinlicher gesucht wird. Wenn ich jetzt sage "silberner Jaguar" würde ein Mensch wissen, daß es wahrscheinlicher ist, daß das Auto gesucht wird und würde ein entsprechendes Bild rausrücken. Bei "Jaguar Raubkatze" würden wohl auch die wenigsten zuerst an ein Großkatzen-Airbrush auf einer Motorhaube denken.

Jetzt ist der Ansatz, daß ich solche Kriterien nicht in die Suche einbaue, sondern die Suchmaschine sich die Kriterien selber baut. Ich baue dafür eine Bewertung des Ergebnisses ein. Wenn die Bewertung nicht optimal war, so modifiziert der Algorithmus seine internen Parameter. Wird bei der nächsten Bewertung für dieselbe Suche ein besseres Ergenis erziel, behält er diese Parameter, ansonsten nimmt er wieder die alten. Der Algorithmus entwickelt sich sozusagen evolutionär.
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

5

Montag, 6. Februar 2006, 18:25

Zitat

Original von Darth Lommel
Das hab ich irgendwo mal gehört. Als Beispiel zum Jaguar. Das Wort allein ist uneindeutig, man kann höchstens sagen, was wahrscheinlicher gesucht wird. Wenn ich jetzt sage "silberner Jaguar" würde ein Mensch wissen, daß es wahrscheinlicher ist, daß das Auto gesucht wird und würde ein entsprechendes Bild rausrücken. Bei "Jaguar Raubkatze" würden wohl auch die wenigsten zuerst an ein Großkatzen-Airbrush auf einer Motorhaube denken.


Dieses Argument kam auch so in der Weise von einem meiner Betreuer. Ich gebe zu da ist was dran, aber durch die Hinzunahme von weiteren Worten in die Suchkriterien, verschwinden neben unerwünschten auch gewünschte Ergebnisse. Beispiel der User sucht die Raubkatze und gibt bei der Suchmaschine seiner Wahl
"Jaguar -Auto*" ein und jetzt werden auch Treffer über eine Autosafari entfernt.

Zitat

Original von Darth Lommel
Jetzt ist der Ansatz, daß ich solche Kriterien nicht in die Suche einbaue, sondern die Suchmaschine sich die Kriterien selber baut. Ich baue dafür eine Bewertung des Ergebnisses ein. Wenn die Bewertung nicht optimal war, so modifiziert der Algorithmus seine internen Parameter. Wird bei der nächsten Bewertung für dieselbe Suche ein besseres Ergenis erziel, behält er diese Parameter, ansonsten nimmt er wieder die alten. Der Algorithmus entwickelt sich sozusagen evolutionär.


Das ist genau nicht der Ansatz des Semantic Web. Es geht darum die Dokumente des Web "schlauer" zu machen und nicht die Suchmaschine. Denn damit eine Suchmaschine die Bedeutung eines Wortes erfassen kann, müßte sie den Kontext analysieren und das ist wirklich noch Zukunftsmusik.

6

Montag, 6. Februar 2006, 18:37

Es ist doch aber völlig egal, ob ich mir dem Ansatz bei den Dokumenten ioder der Suchmaschine anfange. Es kann nur beides zusammen funktionieren. Wenn ich hyperintelligente Dokumente habe, die so intelligent sind, daß sie keine Suchmaschine versteht, bringt mir das gar nichts.
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

7

Montag, 6. Februar 2006, 18:38

Ich bin mit nicht sicher, ob ich jetzt das selbe darunter verstehe wie Ihr - ich meine aber, ein Buch/Heft zu dem Thema entweder zu haben oder mal gelesen zu haben. Da ging es WIMRE um mindmapping artige Strukturen von Webseiten. Ich müsste aber nochma nachsehen.

Ansonsten:
Mag ja sein, dass mein Blickwinkel da etwas eng ist - aber ich sehe relativ wenige prizipielle möglichkeiten, das www "verbessern". Gopher war eine Alternative, die aufgrund ihrer Lizenzkosten den Bach runter gegangen ist.

Letztendlich hat man, wenn man nicht die Struktur (s.o.) ändern will, nur die Wahl, die Webseiten komplexer zu machen oder die Suchmaschinen. Ich halte da den Status quo für einen brauchbaren Kompromiss - auch hinsichtlich der Möglglichkeiten des Informationszugangs.

Wobei - ich möchte wetten, dass es irgendwann Webseiten "for counted eyes only" mit DRM gibt - Ansätze für E-Mail Porto sind ja bereits in den News.


Thomasch,
Webseseiten Lynx fähing schreibend.
______________________________

Das Recht auf Dummheit gehört untrennbar zum Recht auf die freie Entfaltung der Persönlichkeit und ist damit verfasungsrechtlich geschützt.
[SIZE=1](R. Schwentker in de.alt.sysadmin.recovery)[/SIZE]

8

Montag, 6. Februar 2006, 18:53

Zitat

Original von Darth Lommel
Es ist doch aber völlig egal, ob ich mir dem Ansatz bei den Dokumenten ioder der Suchmaschine anfange.


Na ganz so egal ist das nicht. Die heutigen Suchmaschine brauchen ja schon heute, sehr viel Zeit um die Webseiten zu indizieren. Komplexität ist eine Sache die man nicht unterschätzen sollte.

@thomasch

Das mit dem Mindmapping geht schon in die richtige Richtung.

Zitat

Original von thomasch
IAnsonsten:
Mag ja sein, dass mein Blickwinkel da etwas eng ist - aber ich sehe relativ wenige prizipielle möglichkeiten, das www "verbessern". Gopher war eine Alternative, die aufgrund ihrer Lizenzkosten den Bach runter gegangen ist.

Letztendlich hat man, wenn man nicht die Struktur (s.o.) ändern will, nur die Wahl, die Webseiten komplexer zu machen oder die Suchmaschinen. Ich halte da den Status quo für einen brauchbaren Kompromiss - auch hinsichtlich der Möglglichkeiten des Informationszugangs.

Wobei - ich möchte wetten, dass es irgendwann Webseiten "for counted eyes only" mit DRM gibt - Ansätze für E-Mail Porto sind ja bereits in den News.


Deshalb ist das Semantic Web auch als Erweiterung gedacht und nicht als "Must-have". Aber meine Befürchtung (das werde ich auch am Ende meiner Diplomarbeit schreiben), ist auch das sich niemand die Mühe macht und seine Webseite auch noch mit Semantik füllt. Die meisten haben schon Probleme gültiges HTML zu produzieren.

Ich kann nur hoffen, dass das den DRM-Seiten niemals kommt.

Zitat

Original von thomasch
Thomasch,
Webseseiten Lynx fähing schreibend.


Viel Erfolg !

9

Montag, 6. Februar 2006, 19:35

Das was du erklärst bedarf aber einer neuen Suchmaschine, die mit dieser neuen Datenstruktur zurande kommt.
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

10

Montag, 6. Februar 2006, 19:46

@Lommel Jepp, da hast Du natürlich Recht und ich habe keine Ahnung, ob Google und Konsorten den Weg wirklich beschreiten werden. Ich glaube irgendwo gelesen zu haben, das Google an der Sache kein Interesse hat.

11

Montag, 6. Februar 2006, 20:50

Sowas befürchte ich auch. Aber dann ist halt eine neue Suchmaschine dran, die die entsprechenden Infos lesen kann. Dann wird google schnell weg vom Fenster sein, denke ich.
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

12

Dienstag, 7. Februar 2006, 13:08

Zitat

Original von Malkavian
Aber meine Befürchtung (das werde ich auch am Ende meiner Diplomarbeit schreiben), ist auch das sich niemand die Mühe macht und seine Webseite auch noch mit Semantik füllt.


Da vertrau ich mal auf den Markt. Letztendlich wird der, der will, dass seine Seite gefunden wird, alles ihm mögliche dafür tun - sofern es sich rechntet.

Interesannt dürfte an dieser Stelle sein, in wie weit es dann zu einer wie auch immer gearteten Differenzierung des Webs kommt. Schon jetzt ist teilweise der Geschäftserfolg eines Unternehmens sehr eng mit der Plastzierung in einer Suchmaschine verbunden.

Denkbar sind, wie google das schon beginnt, Suchportale, die Suchergebnisse auf unterschiedliche Art und Weise generieren.

Ich könnte mir aber auch vorstellen, dass es irgendwann mal ganz andere arten von Suchmaschinen gibt. Wenn mein Kühschrank merkt, dass die Milch alle ist, könnte der auch gleich welche nachbestellen. Dazu muss er aber wissen, wo er das tun soll. Analog dazu könnte mein Auto mir vorschlagen, wo es am güstigsigsten ist zu tanken. Dazu bräuchte es aber dann, neben aktuellen Verkehrsdaten auch eine Verortung der Suche.

Thomasch
______________________________

Das Recht auf Dummheit gehört untrennbar zum Recht auf die freie Entfaltung der Persönlichkeit und ist damit verfasungsrechtlich geschützt.
[SIZE=1](R. Schwentker in de.alt.sysadmin.recovery)[/SIZE]

13

Dienstag, 7. Februar 2006, 13:36

Zitat

Original von thomasch
Da vertrau ich mal auf den Markt. Letztendlich wird der, der will, dass seine Seite gefunden wird, alles ihm mögliche dafür tun - sofern es sich rechntet.

Interesannt dürfte an dieser Stelle sein, in wie weit es dann zu einer wie auch immer gearteten Differenzierung des Webs kommt. Schon jetzt ist teilweise der Geschäftserfolg eines Unternehmens sehr eng mit der Plastzierung in einer Suchmaschine verbunden.

Denkbar sind, wie google das schon beginnt, Suchportale, die Suchergebnisse auf unterschiedliche Art und Weise generieren.


Dem "Markt" vertrauen ist immer so eine Sache. Dank der Erweiterungen ein paar Browserhersteller, habe wir doch den Browserkrieg gehabt.

Ja, die Differenzierung des Web schreitet voran. Der Ansatz des Semantic Web ist vielleicht auch ein Versuch, die Funktionen des Web Service ins WWW zu integrieren.

Das mit den Suchportalen ist eine gute Idee, aber ist es nicht ein wenig sinnlos für jeden Bedarf ein eigenes Portal zu schreiben?

14

Dienstag, 7. Februar 2006, 13:56

Zitat

Original von Malkavian
Dem "Markt" vertrauen ist immer so eine Sache. Dank der Erweiterungen ein paar Browserhersteller, habe wir doch den Browserkrieg gehabt.


An dem sich jedoch letztendlich gezeigt hat, dass sich an dieser Stelle Alleingänge nicht lohnen.

Zitat

Original von Malkavian
Das mit den Suchportalen ist eine gute Idee, aber ist es nicht ein wenig sinnlos für jeden Bedarf ein eigenes Portal zu schreiben?


Da haben wir uns falsch verstanden. Ich meinte das eher in die Richtung, dass der Benutzer zu gleichen Suchbegriffen unterschiedliche Ergebnisse haben möchte - je nach dem, ob er eher Masse oder eher Klasse haben will.

Thomasch
______________________________

Das Recht auf Dummheit gehört untrennbar zum Recht auf die freie Entfaltung der Persönlichkeit und ist damit verfasungsrechtlich geschützt.
[SIZE=1](R. Schwentker in de.alt.sysadmin.recovery)[/SIZE]

15

Dienstag, 7. Februar 2006, 14:01

Der Punkt ist doch, daß man erst einmal eine geeignete informationstheoretische Beschreibung samt Lösung dieses Problems braucht. Wie man das dann implementiert ist doch max. von der Client- bzw. Server-Performance abhängig. Wobei ich nicht glaube, daß eine Suchmaschine einen 3 GHz-Rechner in die Knie zwingt. ;-)
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

16

Dienstag, 7. Februar 2006, 15:29

Zitat

Original von Darth Lommel
Der Punkt ist doch, daß man erst einmal eine geeignete informationstheoretische Beschreibung samt Lösung dieses Problems braucht. Wie man das dann implementiert ist doch max. von der Client- bzw. Server-Performance abhängig. Wobei ich nicht glaube, daß eine Suchmaschine einen 3 GHz-Rechner in die Knie zwingt. ;-)


Der Witz ist es gibt genug theoretische Beschreibungen und leider gibt es auch genau so viele Lösungen.

Ja, leider gibt es Probleme in der Informatik, die sich nicht durch gigantische Rechenkraft lösen lassen.

17

Dienstag, 7. Februar 2006, 15:44

Wenn es noch keine Allroundlösung gibt, können ja die Beschreibungen noch nicht so toll sein... ;-)
______________________________

Warum sollte man Zeit mit unnützen Tätigkeiten vergeuden, wenn man sie doch einfach sinnlos verstreichen lassen kann ?

18

Mittwoch, 19. Juli 2006, 10:26

Für die Leute, die es interessieren sollte gibt es in der aktuellen Technolgy Review eine Artikel der sich mit der Thematik befasst. Die Online-Version gibt es hier.