PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Weltwissen im ASCII-Format



nemro
17.12.2005, 13:53
Hallo,

ich suche nach Textdateien die Weltwissen bzw. Definitionen
in folgender Form enthalten:

Europa ist ein Kontinent.
Deutschland ist ein Land.
Deutschland ist kein Kontinent.
Europa ist kein Land.
Eine Maus ist ein Nagetier.
Computermäuse sind keine Nagetiere.

Also jeweils möglichst kurze Sätze die mit einem Punkt enden.

MfG. nemro

Manf
17.12.2005, 16:40
Nicht unwesentliche Teile des Weltwissens sind in einigen Werken (http://www.kursbuch.com/) zusammengefasst die in kurzen und präzisen Angaben die relevante Information beschreiben.

Aus der Ankündigung (http://s134260722.online.de/drehscheibe-online/forum/read.php?f=17&i=104883&t=104883):
"Das Werk zeigt eine ungewöhnliche Reinheit der Sprache, und man sollte nicht zögern, es gerade der heranreifenden Jugend in die Hände zu legen, um sie mit den ganz natürlichen Vorgängen des Lebens vertraut zu machen!"

Der Text wird sich leicht in die in die gewünschte Form umformatieren lassen, falls das weiterhilft.
Manfred

nemro
18.12.2005, 13:37
Leider konnte ich auf den angegebenen Seiten nicht das finden was ich suche. Es geht um ein IPS (http://chat.multidat.net/ai_chat/ki_chat.html) welches, auf Basis bestimmter Regeln, Informationen verarbeitet und bewertet.

Hierfür werden Berschreibungen von Begriffen und Sachverhalten in einfachen Sätzen benötigt.

MfG. nemro

SnoopysBot
18.12.2005, 18:54
Ach nemro, warum merkst Du nicht, das Manf Dich ein bißchen veräppelt?

Vielleicht helfen Dir diese Links zum Semantischen Web weiter:
http://www.schemaweb.info/ --> Siehe hier vor allem Hot Schemas
http://www.semanticweb.org/

Allerdings stellen alle diese Webseiten nur einen winzigen Ausschnitt des Weltwissens dar und das noch dazu in einem XML-Format, das sich Resource Description Framework (RDF) nennt. Das sind zwar auch Textdateien, haben aber ein anderes Format, als von Dir gewünscht.

Interessant wären RDF-Dateien, mit denen sich ein Roboter etwas besser in einem Zimmer zurechtfinden würde. So im Sinne

<rdf:RDF>
....<Bot:Stuhl Verschieben="Ja" Drueberklettern="Ja" Drunterdurch="Nein">
........<Bot:Teil Anzahl="3..4" Verschieben="Nein">Stuhlbein</Bot:Teil>
........<Bot:Teil Anzahl="1" Verschieben="Nein">Lehne</Bot:Teil>
....</Bot:Stuhl>
</rdf:RDF>

Damit "wüsste" der Roboter dann, dass er
einen Stuhl verschieben kann; ein Stuhlbein oder eine Stuhllehne jedoch nicht
die drei bis vier Stuhlbeine sowie die eine Lehne sich mit dem Stuhl bewegen, weil sie Teile von ihm sind, wenn er den Stuhl verschiebt
dass er, um sein Ziel zu erreichen, zwar über einen Stuhl klettern kann, nicht jedoch unter ihm hindurchkriechen
Das wäre doch schon was, oder?

Manf
18.12.2005, 19:41
Ach nemro, warum merkst Du nicht, das Manf Dich ein bißchen veräppelt?
Auch wenn es sich um ein Thema handelt das von Loriot aufgegriffen wurde, ist es doch wie gewohnt sehr anspruchsvoll.

Da hier sämtliche Bewegungen der Bahn erfasst sind, auch ohne Berücksichtigung der Kapazität, solässt sich daraus immerhin die Bewegung der antreibenden Lokomotiven ableiten.

Führt man nämlich die Nebenbedingungen ein, die im Kursbuch nicht beschrieben sind, dass ein Zug jeweils eine Lokomotive benötigt, und dass Lokomotiven keine Leerfahrten durchführen sollen, dann lässt sich aus der Summe der Daten ableiten dass an keinem Ort eine bleibende Differenz der eintreffenden und abgehenden Bewegungen auftreten darf.

Schon eine Differenz von 5 Bewegungen pro Stunde zwischen den eintreffenden und abgehenden Zügen, die auch einem aufmerksamen Beobachter auf einem großen Bahnhof kaum auffallen dürfte, würde zu einer Häufung von 120 Lokomotiven pro Tag oder 43800 Lokomotiven pro Jahr führen. Der betriebswirtschaftliche Kapitalzuwachs oder -Abfluß pro Bahnhof und Jahr wäre ohne Frage von großer Bedeutung.

Mit welchem Ziel soll denn eine Auswertung durchgeführt werden?
Manfred

nemro
19.12.2005, 08:03
Das würde schon etwas eher dem gesuchten Format entsprechen.



Mit welchem Ziel soll denn eine Auswertung durchgeführt werden?


Das Endziel ist ein IPS, welches natürliche Sprachen erlernen
kann. Hierbei geht es nicht um ein Sprachverständnis (im menschlichen Sinn), sondern um die Bewertungen von Sprachelementen und Berechnung von Bedeutungswahrscheinlichkeiten.
Berücksichtigt werden dabei u.a. die Interlanguage-Hypothese und Ergaenzungstheorie.

Um aussagekräftige Ergebnisse zu erhalten, sind
entsprechend umfangreiche Eingaben nötigt.

MfG. nemro

PicNick
19.12.2005, 10:09
Du schlägst ziemlich wild um dich mit Hypothesen und Theorien.
Wie wär's mit ein wenig Praxis, um deine Steinzeitsensorik (ASCII mit Punkt) etwas dem 21. Jahrhundert anzunähern ?

Thomas Sc.
21.12.2005, 14:03
Ob es nemro weiterhelfen kann, sei dahingestellt, aber für alle, die geballtes Weltwissen in einem sinnvollen, offenen Format suchen:

www.opencyc.org

have fun,
Thomas

21.12.2005, 18:35
Thomas Sc.: Hochinteressant! Diese Seite kannte ich noch nicht.

Vor allem das Beispiel, wie drei Cyc-Agenten zusammenarbeiten, um eine Anfrage wie "list all elected heads of government of countries north of the equator" (frei übersetzt: "liste alle gewählten Regierungschefs von Ländern nördlich des Äquators auf") beantworten zu können: beeindruckend!

nemro
22.12.2005, 07:40
Ob es nemro weiterhelfen kann, sei dahingestellt, aber für alle, die geballtes Weltwissen in einem sinnvollen, offenen Format suchen:


Ob es wirklich geeignet ist, müsste überprüft werden.
Jedenfalls scheint es lohneswert, das Projekt mal
etwas näher zu betrachten.

MfG. nemro