PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : WIE DEN MOTIVIERTEN AUTONOMEN ROBOTER LERNEN?



schurm2
05.11.2006, 14:23
Hallo,

Nachdem ich über die Intelligenz des Motivierten autonomen Roboters (charakterisiert im Bericht in diesem Forum und in http://mywebpage.netscape.com/alschurm1/page2.html ) berichtete (s. mein Bericht in diesem Forum oder http://mywebpage.netscape.com/alschurm1/page7.html ) informiere ich wie man diesen Roboter lernen kann und soll.

Aus praktischen Gründen muß der motivierte autonome Roboter lern- und adaptationsfähig sein, egal ob er Haushalts- oder Industrieroboter ist. Ich nehme an daß der Roboter einige bekannte Programme für Bildung visueller und akustischer (vielleicht auch Geruch-) Muster hat.
Der Roboter muß zusätzlich folgende lern- und adaptationsfähigkeiten haben um auch in veränderter Umgebung intelligent zu handeln:
i. neue Eigenschaften eines Objektes erkennen;
ii. Objektmodell für neues Objekt bilden und in die Wissensbasis eintragen;
iii. Situationsmodelle für neue wichtige Situationen bilden und in die Wissensbasis eintragen;
iv. Aktivitätsschemas für Bedienung neuer Geräte und Maschinen, eventuell in neuen Räumen, adaptieren;
v. neue Aktivitätschemas bilden.

1. Neue Eigenschaften eines bekannten Objektes lernen
Der Roboter kann selbstständig visuelle und akustische (und Geruch) Änderungen eines Objektes, dessen Objektmodell er hat, erkennen und, mittels der gesagten Programme für Bildung von Mustern, neue visuelle und akustische (bzw. Geruch) Muster bilden und in das Modell des Objektes ( in der Baumartigen Wissensbasis, sehe ..."1 Abstrakte Objekt- und Situationsmodelle...." in http://mywebpage.netscape.com/alschurm1/page7.html ) eintragen. Der Roboter kann auch selbstständig einige Gewohnheiten oder Zustände eines Objektes erkennen und in dessen Objektmodell eintragen; Beispiele solcher Eigenschaften: "Person x steht zwischen 6:30 und 6:45 auf", "Person x ißt zwischen 7:15 und 7:35 Frühstück", "Gerät g1 funktioniert nicht", "Wasser fließt nicht in die Waschmaschine wenn sie eingeschaltet wird", "von Montags bis Freitag von 7:50 bis 17:00 Uhr ist nicht Person x in der Wohnung".
Viele neue Eigenschaften eines Objektes müßen jedoch durch zuständige Person dem Roboter gegeben werden (der sie dann im Objektmodell einträgt); Beispiele: "Person y ist krank", "Kind k1 ist 11 Jahre alt", "Kinder jünger als 11 Jahre dürfen nicht Streichhölzer und Feuerzeug in die Hand nehmen".

2. Erkennen/Lernen eines unbekannten Objektes
Objektmodelle in der Wissensbasis sind in einem Baumen ähnlichem Graph als Knoten gespeichert, in dem von oben entlang Zweigen sehr abstrakte Objektmodelle (z.B. für Maschine, Behälter, Pflanzen), weniger abstrakte, bis zu Modellen konkreter Objekte gespeichert sind (sehe "1. Abstrakte Objekt- und Situationsmodelle...." in http://mywebpage.netscape.com/alschurm1/page7.html ). Ein Objektmodell hat alle Eigenschaften des Vorgängerknotens/Objektmodells. Wenn der Roboter ein Objekt,On, bemerkt (visuell oder mittels anderen Sensoren), sucht er im Baum, von oben nach unten, zu welcher kleinsten Klasse, MOk), von Objekten On gehört (d.h. findet Objektmodell M(Ok) für das On ein Fall ist und kein Nachfolgeknoten des M(Ok) ist ein Modell für On). Falls für On kein konkretes Objektmodell ist (d.h. M(Ok) hat Nachfolgeknoten) dann betrachtet der Roboter On als neues Objekt und bildet:
a) selbstständig ein Objektmodell, Ms(On), für das Objekt On, oder
b) Objektmodell M(On) im Dialog mit einer zuständigen Person.
Im Falle (a), bildet der Roboter das Modell Ms(On) aufgrund des Modells M(Ok); er trägt in Ms(On) nur die Eigenschaften des Objektes On ein die er erkannt hat. Für Ms(On) gelten jedoch alle Eigenschaften der Objektmodelle im Teilzweig von M(Ok) nach oben, so daß er zugleich zusätzliches Wissen über das Objekt On lernt. Selbstgebildete Objektmodelle markiert er mit "selb". Das Objektmodell Ms(On) trägt der Roboter als Nachfolgeknoten des Modells M(Ok) ein.
Im Fall (b), bildet der Roboter das Modell für On, M(On), im Dialog mit einer zuständigen Person, Pz. Zuerst muß Pz akzeptieren, daß M(On) ein Fall von M(Ok) ist (der Roboter könnte außer M(Ok) auch erkennen daß On auch ein Fall von einem anderen Modell, M(Or), ist) und als dessen Nachforlgeknoten eingetragen sein soll. Wenn Pz dies nicht akzeptiert, schlägt der Roboter vor zu welchem anderen Objektmodell, M(Od), das Objekt On gehören könnte. Die Person Pz kann auch neues abstraktes Objektmodell, M(Oa), als Nachfolgeknoten des M(Ok) (bzw. M(Od)), im Dialog mit dem Roboter bilden und danach das Modell M(On) als Nachfolgeknoten des Modells M(Oa) eintragen. Aufgrund des Modells M(Ok) (bzw. M(Oa)) fragt der Roboter nach den Eigenschaften des Objektes On und die Person Pz antwortet. In dieser Weise wird das Modell M(On) gebildet.

3. Neue Situationen und Aktivitäten lernen
Bei Änderung der Umgebung (z.B. der Roboter zieht in neue Wohnung oder Fabrikhalle ein, neue Maschine soll vom Roboter bedient werden) entstehen auch neue Situationen auf die der Roboter reagieren (d.h. Aktivitäten ausführen) muß. Er muß also einige Situationsmodelle und Aktivitätsschemas zu den neuen Situationen und Aktivitäten adaptieren. Diese Adaptation (das Lernen neuer Aktivität) wird wie folgt durchgeführt:

Es sei, der Roboter soll neue Maschine, Mn, bedienen. Das Objektmodell der Maschine Mn ist gebildet worden. Er sucht und findet eine Maschine, Ma, die der Maschine Mn ähnlich ist und die er bedienen kann (d.h. entsprechende Aktivitätsschemas hat). Der Roboter adaptiert ein Aktivitätsschema, AMa, für Bedienung der Maschine Ma zum Aktivitätsschema für Bedienung der Maschine Mn im Dialog mit einer zuständigen Person, Pz, und stellt Fragen und aktualisiert:
i) in bezug auf Situationsmodelle im Aktivitätsschema AMa,
- welche Objektmodelle im Situationsmodell (im Aktivitätschema AMa) müßen durch neue ersetzt werden?
- in welcher Entfernung sind die Objekte im neuen Situationsmodell (Lokalisierung der Objekte)?
- trägt Bewegungsmerkmale (Lage, Bewegungslinie, Richtung, Geschwindigkeit) der Objekte ein;
ii) in bezug auf eine Subaktivität ( des Aktivitätsschemas AMa) verbunden mit einer gerichteten Kante (SM1,SM2) (eine Subaktivität enthält eine Folge von elementaren Aktivitäten und Operationen),
- ob die Subaktivität akzeptiert, entfernt oder modifiziert werden soll,
- im letzten Fall, fragt der Roboter, für jede elementare Aktivität, ob sie akzeptiert,entfernt, ersetzt oder modifiziert werden soll,
- in letzten zwei Fällen antwortet die Person Pz welche elementare Aktivität an dieser Stelle ausgeführt werden soll.
Nach Bildung des neuen Aktivitätsschemas für die Maschine Mn, muß dieses Aktivitätsschema experimentell angewandt werden und eventuell weiter adaptiert werden.
In dieser Weise kann der Roboter mit Hilfe der zuständigen Person auch ganz neue Aktivitäten lernen.

4. Sollen andere Lernmethoden angewandt werden?
Einige Leser könnten meinen, der Roboter lernt zu wenig selbstständig - das neue Wissen und die neue Aktivitäten werden mittels aktiver Hilfe einer Person eingetragen. Ich bin der Meinung, daß die angewandten Lernmethoden richtig sind, für einen Roboter der nicht auf dem Mond oder 1000 m unter Wasser arbeitet, weil sogar intelligente Schüler und Studenten lernen in ähnlicher Weise - das Wissen und neue Fähigkeiten sind von Spezialisten (direkt als Lehrer oder indirekt mittels Büchern) mittels aktiver Teilnahme der Schüler/Studenten in deren Gehirne eingetragen; nur das Eintragen von Wissen in den gesagten (in (1), (2) und(3)) Roboter verläuft im allgemeinen schneller als bei Menschen.

Sind "Roboter Schulen" eine Lösung?
Auch die "selbstlernenden Roboter" (Engl.: developmental robots), von J. Weng und Y. Zhang in USA, und E. Prassler in Deutschland, lernen nicht selbstständig sondern mit Hilfe einer Person - auch Kinder lernen nicht selbstständig sondern mit Hilfe älterer Personen. Die Ergebnisse der "selbstlernenden Roboter", von Weng und Zhang und die erwarteten Ergebnisse im Projekt XPERO, sind enttäuschend. Es kann auch nicht anders sein, solange die Autoren solcher Projekte nicht die Grundsteine der Intelligenz in die Roboter einbauen (ein Hund kann nur das lernen was ihm die eingebauten primitiven Intelligenzgrundsteine ermöglichen).
Einige Grundsteine der Intellegenz sind im motivierten autonomen Roboter eingebaut. Mittels diesen Intelligenzeigenschaften kann der Roboter, wie oben dargestellt, nicht nur unbekannte Objekte klassifizieren/identifizieren und deren interne Modelle bilden, aber auch mit Hilfe einer Person neue komplexe Aktivitäten lernen.
Aber sogar wenn alle Grundsteine der Intelligenz, wie ein intelligenter Mensch hat, in einen Roboter eingebaut wären (was in den nächsten 40 Jahren unwahrscheinlich ist), müßte man ihn, mittels der Lernmethode von Weng und Zhang, ungefähr 8 Jahre lernen um ihm das nötige Wissen und die nötigen Fähigkeiten beizubringen.
Es ist auch nicht kontrollierbar was ein "selbstlernender Roboter" lernt, was er nicht lernt und zu welchen Aktivitäten er fähig ist; in solcher "Roboter Schule" können sich Roboter-Verbrecher entwickeln. Reiche Sponsoren geben Millionen aus für Forschung und Entwicklung solcher Roboter. Bei Befürwortern zuverlässiger und menschenfreundlicher Roboter müßten die Alarmglocken läuten. Solche "Roboter Schulen" können nicht der Weg sein intelligente und zuverlässige Roboter herzustellen.

MFG

A. Schurmann

ogni42
07.11.2006, 19:16
Man muss den Roboter nicht lernen, sondern lehren.

Der Roboter lernt dann.

zu 1). Geht grundsätzlich. In der Hauptsache besteht das Problem im Anlegen einer Grundwissensbasis, sowie im Erkennen und Bewerten von Eigenschaften. Dafür braucht es ebenfalls eine (zweite) Wissensbasis, die zumindest Merkmalstypen, die zu Eigenschaften kombiniert werden (Dritte WBasis, nämlich Verknüpfung der Merkmale zu den zu bewertenden Eigenschaften/Verhalten) enthält. Auch diese beiden Basen müssen mit Lehrer trainiert werden.

zu 2.) Geht so nicht, da wenn O_n keine Blätter hat, niemals selbständig ein Blatt erzeugt wird. Alternativ ginge da über die Bewertung von Ähnlichkeitsmaßen. Dafür gibt es aber bessere Strukturen als Bäume, z.B. Support Vector Maschinen, Adaptive Mixture of Experts o.ä. die sich ebenfalls hierarchisieren lassen.

3/4) Es geht besser mit Lehrer aber auch ohne Lehrer, dann aber langsamer. Dazu muss aber das Belohnungsschema/Ziel fest stehen. Hierbei ist aber ein Scheitern möglich, wenn mit keiner Handlungsalternative dem Ziel näher gekommen werden kann.

Madgyver
07.11.2006, 19:43
Was ich nicht ganz verstehe:

Wie ist der begriff "voll-autonom" zu verstehen, wenn neues Wissen von einem Lehrer angepasst bzw. eingetragen werden muss.

Es wird ja in den Links von der enormen wirtschaftlichen und industriellen Wichtigkeit der Voll autonomen motivierten Roboter herausgearbeitet und betont, wie aber wird abstraktes Wissen wie z.B. das Handling von "Nicht griffsicheren Waren" wie z.B. Obst, Gemüse und der gleichen gelernt bzw. erfasst? Dabei geht es mir nicht um das Datenbanksystem (acuh wenn dies auch interessant wäre) sondern eher um die tatsächliche Erfassung dieser Daten mit der visuellen Erfassung zu kucken wann der Saft aus der Tomate läuft ist wohl keine Optimallösung.

schurm2
09.11.2006, 15:00
ogni42:
[highlight=red:ac3e8f9e58] zu 1). Geht grundsätzlich. In der Hauptsache besteht das Problem im Anlegen einer Grundwissensbasis, sowie im Erkennen und Bewerten von Eigenschaften. Dafür braucht es ebenfalls eine (zweite) Wissensbasis, die zumindest Merkmalstypen, die zu Eigenschaften kombiniert werden (Dritte WBasis, nämlich Verknüpfung der Merkmale zu den zu bewertenden Eigenschaften/Verhalten) enthält. Auch diese beiden Basen müssen mit Lehrer trainiert werden.[/highlight:ac3e8f9e58]

Man braucht nicht zweite und dritte Wissensbasis. Im Modell des Objektes (in der Wissensbasis) sind Merkmalstypen und Eigenschaften des Objektes eingetragen.

ogni42: [highlight=red:ac3e8f9e58] zu 2.) Geht so nicht, da wenn O_n keine Blätter hat, niemals selbständig ein Blatt erzeugt wird. Alternativ ginge da über die Bewertung von Ähnlichkeitsmaßen. Dafür gibt es aber bessere Strukturen als Bäume, z.B. Support Vector Maschinen, Adaptive Mixture of Experts o.ä. die sich ebenfalls hierarchisieren lassen.[/highlight:ac3e8f9e58]

In (2) ist nicht gesagt, daß wenn O-n keine Blätter hat, der Roboter selbstständig Nachfolgeknoten von O-n bildet.

ogni42: [highlight=red:ac3e8f9e58]3/4) Es geht besser mit Lehrer aber auch ohne Lehrer, dann aber langsamer. Dazu muss aber das Belohnungsschema/Ziel fest stehen. Hierbei ist aber ein Scheitern möglich, wenn mit keiner Handlungsalternative dem Ziel näher gekommen werden kann.[/highlight:ac3e8f9e58]

Der Roboter soll nicht durch Belohnungswerte gelehrt werden. Im Dialog schlägt derRoboter vor welche Informationen eingetragen sein sollen. Die Zuständige Person bestätigt oder korrigiert sie. Durch Fragen erhält der Roboter Informationen die er braucht. Die zuständige Person ist kein Lehrer, sondern hat die Rolle eines Informanten.

schurm2

ogni42
09.11.2006, 15:30
Man braucht nicht zweite und dritte Wissensbasis. Im Modell des Objektes (in der Wissensbasis) sind Merkmalstypen und Eigenschaften des Objektes eingetragen.

Da ist aber nicht das Verhalten zur Beobachtung eingetragen. Dazu habe ich die weiteren Basen vorgeschlagen. Das kann man da vielleicht reinpacken, wäre aber kein gutes Design, da sich bei einer Verfeinerung das Beobachtungsverhalten ändern kann und somit der keine Verfeinerung der Beobachtung mehr existiert.

Wie soll so etwas in der Wissensbasis repräsentiert werden. Kannst Du ein (am Besten grafisches) Beispiel für einen solchen Baum und die an den Knoten liegenden Elemente geben? Vielleicht habe ich das Prinzip ja nicht verstanden.




In (2) ist nicht gesagt, daß wenn O-n keine Blätter hat, der Roboter selbstständig Nachfolgeknoten von O-n bildet.

Richtig, und deswegen kann der Roboter die Wissensbasis nie selbständig um neue Objekte bzw. Objektdetaillierungen erweitern. D.h es gilt nur 2b) Erweiterung mit Lehrer.


Der Roboter soll nicht durch Belohnungswerte gelehrt werden. Im Dialog schlägt derRoboter vor welche Informationen eingetragen sein sollen. Die Zuständige Person bestätigt oder korrigiert sie. Durch Fragen erhält der Roboter Informationen die er braucht. Die zuständige Person ist kein Lehrer, sondern hat die Rolle eines Informanten.

Wie soll der Roboter ohne Reinforcement-Learning selbständig Neues, für das keine Hypothese gebildet werden kann, hinzu lernen?

schurm2
09.11.2006, 15:50
Madgyver:
[highlight=red:be9635752f]Wie ist der begriff "voll-autonom" zu verstehen, wenn neues Wissen von einem Lehrer angepasst bzw. eingetragen werden muss.

Es wird ja in den Links von der enormen wirtschaftlichen und industriellen Wichtigkeit der Voll autonomen motivierten Roboter herausgearbeitet und betont, wie aber wird abstraktes Wissen wie z.B. das Handling von "Nicht griffsicheren Waren" wie z.B. Obst, Gemüse und der gleichen gelernt bzw. erfasst? Dabei geht es mir nicht um das Datenbanksystem (acuh wenn dies auch interessant wäre) sondern eher um die tatsächliche Erfassung dieser Daten mit der visuellen Erfassung zu kucken wann der Saft aus der Tomate läuft ist wohl keine Optimallösung.[/highlight:be9635752f]

Voll-autonome bedeutet daß der Roboter, aufgrund der gegenwärtigen Situationen, selbstständig Aktivitäten ausführt. Wenn sich jedoch seine Umgebung ändert, muß er sich anpassen und die Elemente der neuen Umgebung lernen ( mit Hilfe einer Person). Auch ein Mensch, wenn er eine neue Maschine kauft, muß über die Bedienung dieser Maschine lernen (Lesen und die Bedienung ausprobieren). Weil der Roboter nicht lesen kann, braucht er die Hilfe einer Person.

Es wird angenommen, daß der Roboter elementare Bewegungen vorprogrammiert hat, z. B. Handbewegungen. Mittels dieser elementaren Bewegungen bestimmt/entwickelt Programmierer des Roboters die Aktivitäten die der Roboter ausführen soll (solange bis der Roboter diese Aktivitäten richtig ausführt); in dieser Phase benutzt der Programmierer keine übliche Programmierungssprache sondern: Aktivitätsmodelle, Elementare Aktivitäten die der Roboter ausführen kann und schon gelernte/gelehrte einfache Aktivitäten des Roboters.

schurm2

schurm2
09.11.2006, 16:46
ogni42:
[highlight=red:e1f622a732]Da ist aber nicht das Verhalten zur Beobachtung eingetragen. Dazu habe ich die weiteren Basen vorgeschlagen. Das kann man da vielleicht reinpacken, wäre aber kein gutes Design, da sich bei einer Verfeinerung das Beobachtungsverhalten ändern kann und somit der keine Verfeinerung der Beobachtung mehr existiert.

Wie soll so etwas in der Wissensbasis repräsentiert werden. Kannst Du ein (am Besten grafisches) Beispiel für einen solchen Baum und die an den Knoten liegenden Elemente geben? Vielleicht habe ich das Prinzip ja nicht verstanden.[/highlight:e1f622a732]

Wenn ich richtig verstehe was Du unter "Verhalten zur Beobachtung" verstehst, dann aktualisiert der Roboter die Eigenschaften eines Objektmodells z. B. durch statistische Bewertung oder Eintragung der gegenwärtigen visuellen Änderung des Objektes.

ogni42:
[highlight=red:e1f622a732]
Richtig, und deswegen kann der Roboter die Wissensbasis nie selbständig um neue Objekte bzw. Objektdetaillierungen erweitern. D.h es gilt nur 2b) Erweiterung mit Lehrer.[/highlight:e1f622a732]

Nicht so: Der Roboter erkennt selbstständig nur konkrete Objekte. Er erkennt daß ein abstraktes Objektmodell, M(Ok), das beste Modell für das neue Objekt ist. Wenn M(Ok) Nachfolgeknoten hat, dann trägt er das neue Modell Ms(On), als Konkretisierung des Modells M(Ok), als dessen Nochfolger ein. Die Bedingung, daß M(Ok) Nachfolgeknoten haben muß ist nur aus praktischen Gründen gegeben; ohne diese Bedingung könnten unklare strukturen in der Wissensbasis entstehen - aber ich bin nicht sicher ob sie wirklich notwendig ist (das hängt davon ab wie gut die Anfangs-Wissensbasis die Umgebung darstellt)

ogni42:
[highlight=red:e1f622a732]Wie soll der Roboter ohne Reinforcement-Learning selbständig Neues, für das keine Hypothese gebildet werden kann, hinzu lernen?[/highlight:e1f622a732]

Ha, der Roboter ist Neugierig und kann die Wichtigkeit des gegenwärtigen neuen Objektes annähernd bewerten. Wenn das Objekt genügend wichtig ist, bildet und speichert er dessen Modell. Eine Hypothese kann gebildet werden - das gesagte Objektmodell M(Ok) ist die Hypothese.

schurm2

botman
01.01.2007, 19:17
Zu diesem Thema ein Link:
Roboter mit Selbstbewustsein:
http://www.ideenwiki.de/index.php/Roboter
Amerikanische Forscher haben einen Roboter entwickelt, der eine Simulation von sich selbst entwickelt, also so etwas wie ein Selbstbewusstsein. Dafür braucht die Maschine kein kompliziertes Gehirn, aber so etwas wie Neugier.

Artikel: http://www.dradio.de/dlf/sendungen/computer/565331/

ogni42
01.01.2007, 21:24
ogni42:
Da ist aber nicht das Verhalten zur Beobachtung eingetragen. Dazu habe ich die weiteren Basen vorgeschlagen. Das kann man da vielleicht reinpacken, wäre aber kein gutes Design, da sich bei einer Verfeinerung das Beobachtungsverhalten ändern kann und somit der keine Verfeinerung der Beobachtung mehr existiert.

Wie soll so etwas in der Wissensbasis repräsentiert werden. Kannst Du ein (am Besten grafisches) Beispiel für einen solchen Baum und die an den Knoten liegenden Elemente geben? Vielleicht habe ich das Prinzip ja nicht verstanden.

Wenn ich richtig verstehe was Du unter "Verhalten zur Beobachtung" verstehst, dann aktualisiert der Roboter die Eigenschaften eines Objektmodells z. B. durch statistische Bewertung oder Eintragung der gegenwärtigen visuellen Änderung des Objektes.

Ich habe lediglich die Frage gestellt, wie so ein Baum an einem konkreten Beispiel aussieht, wenn Verhalten, Bewertung und Objektabstraktion in einer Wissenbasis gespeichert sein sollen.




ogni42:
Richtig, und deswegen kann der Roboter die Wissensbasis nie selbständig um neue Objekte bzw. Objektdetaillierungen erweitern. D.h es gilt nur 2b) Erweiterung mit Lehrer.

Nicht so: Der Roboter erkennt selbstständig nur konkrete Objekte. Er erkennt daß ein abstraktes Objektmodell, M(Ok), das beste Modell für das neue Objekt ist. Wenn M(Ok) Nachfolgeknoten hat, dann trägt er das neue Modell Ms(On), als Konkretisierung des Modells M(Ok), als dessen Nochfolger ein. Die Bedingung, daß M(Ok) Nachfolgeknoten haben muß ist nur aus praktischen Gründen gegeben; ohne diese Bedingung könnten unklare strukturen in der Wissensbasis entstehen - aber ich bin nicht sicher ob sie wirklich notwendig ist (das hängt davon ab wie gut die Anfangs-Wissensbasis die Umgebung darstellt)

Nochmal: Irgendwann muss es zu dem Punkt kommen, bei dem ein Blatt angelegt wird. Diese erstmalige Anlegen eines Blattes geht nur mit Lehrer. Wenn keine weiteren Knoten/Blätter durch den Lehrer angelegt werden, gibt es keine weiteren Abstraktionen. Oder mal ganz platt gesagt: Wenn alles was wir haben ein Hammer ist, sieht jedes Problem wie ein Nagel aus.

Es fehlt die Motivation. Beispiel aus dem Menschenreich: Die Inuit kennen viele verschiedene Abstraktionen für Schnee, basierend auf Konsistenz, Aussehen, ... Für uns Mitteleuropäer gibt es keine Motivation die zu lernen. Daher werden wir die auch nicht bilden.





ogni42:
Wie soll der Roboter ohne Reinforcement-Learning selbständig Neues, für das keine Hypothese gebildet werden kann, hinzu lernen?

Ha, der Roboter ist Neugierig und kann die Wichtigkeit des gegenwärtigen neuen Objektes annähernd bewerten. Wenn das Objekt genügend wichtig ist, bildet und speichert er dessen Modell. Eine Hypothese kann gebildet werden - das gesagte Objektmodell M(Ok) ist die Hypothese.

Die Neugier ergibt sich aus einer Zielvorgabe. Exploration setzt - auch beim motivierten Menschen - ein Belohnungssystem voraus. Wie oben gesagt, kann der Roboter, so wie von Dir vorgeschlagen ohne Leherer keine neuen Abstraktionen bilden. Das Objektmodell wird daher immer eingeschränkt bleiben.

Nochmals die Bitte: Stelle ein Beispiel für das Objektmodell mit mindestens zwei Kategorien, deren Berwertungs- und Belohungsschema auf und stelle dar, wie das Hinzulernen von neuen Objekten in den Kategorien sowie hinzufügen neuer Kategorien mit und ohne Lehrer funktioniert.

schurm2
05.01.2007, 17:38
ogni42:
Ich habe lediglich die Frage gestellt, wie so ein Baum an einem konkreten Beispiel aussieht, wenn Verhalten, Bewertung und Objektabstraktion in einer Wissenbasis gespeichert sein sollen.

In der Wissensbasis für Objekte sind keine Verhalten (d.h. Aktivitäten) gespeichert. Situationsmodelle sind in einer anderen Wissinsbasis gespeichert. Die Bewertung von Objekten funktioniert in Kürze so: ein Objektmodell hat Reizmuster zugeordnet und aufgrund dieser Reizmuster und aktuellen Bedürfnis- Befriedigungs- und Verlangenswerten berechnet der Roboter den aktuellen Reiz (d.h. die Bewertung) des Objektes.

schurm2:
Der Roboter erkennt selbstständig nur konkrete Objekte. Er erkennt daß ein abstraktes Objektmodell, M(Ok), das beste Modell für das neue Objekt ist. Wenn M(Ok) Nachfolgeknoten hat, dann trägt er das neue Modell Ms(On), als Konkretisierung des Modells M(Ok), als dessen Nochfolger ein. Die Bedingung, daß M(Ok) Nachfolgeknoten haben muß ist nur aus praktischen Gründen gegeben; ohne diese Bedingung könnten unklare strukturen in der Wissensbasis entstehen - aber ich bin nicht sicher ob sie wirklich notwendig ist (das hängt davon ab wie gut die Anfangs-Wissensbasis die Umgebung darstellt)

ogni42
Nochmal: Irgendwann muss es zu dem Punkt kommen, bei dem ein Blatt angelegt wird. Diese erstmalige Anlegen eines Blattes geht nur mit Lehrer. Wenn keine weiteren Knoten/Blätter durch den Lehrer angelegt werden, gibt es keine weiteren Abstraktionen. Oder mal ganz platt gesagt: Wenn alles was wir haben ein Hammer ist, sieht jedes Problem wie ein Nagel aus.

Jedes konkrete Objekt ist ein Blattknoten. Lehrer ist nicht nötig; aber die abstrakte Objektmodelle in der Wissensbasis müßen so durch den Entwickler gebildet und eingegliedert sein, daß für die konkreten Objekte in der Umgebung des Roboters ein genügend genaues abstraktes Objektmodell gegeben ist. Beispiel: der Roboter nam visuell wahr eine neue Waschmaschine Wn; in der Wissensbasis ist das abstrakte Modell " Waschmaschine"; der Roboter erkennt Waschmaschine Wn als eine Konkretisierung des Modells "Waschmaschine" , bildet das Model für Waschmaschine Wn und legt es als Nachfolgeknoten (ein Blattknoten) des Modells "Waschmaschine".

ogni42:
Es fehlt die Motivation. Beispiel aus dem Menschenreich: Die Inuit kennen viele verschiedene Abstraktionen für Schnee, basierend auf Konsistenz, Aussehen, ... Für uns Mitteleuropäer gibt es keine Motivation die zu lernen. Daher werden wir die auch nicht bilden.

schurm2:
Ha, der Roboter ist Neugierig und kann die Wichtigkeit des gegenwärtigen neuen Objektes annähernd bewerten. Wenn das Objekt genügend wichtig ist, bildet und speichert er dessen Modell. Eine Hypothese kann gebildet werden - das gesagte Objektmodell M(Ok) ist die Hypothese.

ogni42
Die Neugier ergibt sich aus einer Zielvorgabe. Exploration setzt - auch beim motivierten Menschen - ein Belohnungssystem voraus. Wie oben gesagt, kann der Roboter, so wie von Dir vorgeschlagen ohne Leherer keine neuen Abstraktionen bilden. Das Objektmodell wird daher immer eingeschränkt bleiben.


Der Roboter funktioniert anders als ein Mensch - z.B. er hat keine Ziele (keine Zielvorgabe) die er mittels Aktivitäten erreichen will (Bemerkung: motivierte Agenten haben meistens solche Zielvorgabe) . Ein Belohnungssystem wie beim Menschen hat der Roboter nicht. Der Roboter bewertet das neue konkrete Objekt aufgrund des gesagten Objektmodells M(Ok) und weil es neu ist. Wenn diese Bewertung gegenwärtig genügend groß ist, führt er Explorationsaktivitäten aus.

schurm2

plusminus
15.01.2007, 20:57
...Der Roboter funktioniert anders als ein Mensch - z.B. er hat keine Ziele (keine Zielvorgabe) die er mittels Aktivitäten erreichen will...

Seit wann hat der Mensch keine Ziele und versucht sie nicht mit Aktivitäten zu erreichen :?:

Der Mensch ist eine etwas weiter entwickelte Art von Tier, die sich fortpflanzt und das mit gewissen Aktivitäten versucht durchzuführen.

Denk mal, ...vor 10.000 Jahren was haben die Menschen da gemacht ? Essen, fortpflanzen, Macht haben. Vielmehr war es nicht und wird es auch nie so wirklich sein... :-k

HannoHupmann
15.01.2007, 22:48
@shurm ähm das ist ziemlich einfach zu lösen: "Roboter fahr nicht gegen die nächste Wand sondern komm ohne Delle in die Küche" schon hat der Roboter ein Ziel, welches er erreichen will, weil es sein Programm vor gibt.

@plusminus das lustig dran ist, um das Ziel essen und fortpflanzung bzw. überleben (Macht lass ich mal aussen vor sie führt ja doch wieder nur zu mehr fortpflanzen oder mehr essen) heutzutage zu erreichen ist sehr viel kompizierter als vor 10.000 Jahren.
Ich mein ein Löwe hat es da viel einfacher, schlafen schlafen schlafen, jagen, fressen, schlafen fortpflanzen schlafen schlafen usw. das macht er von dem Tag an wo er auf die Welt kommt bis zu dem Tag wo er stirbt. Ziemlich unkompliziertes leben (abgesehen von der Tatsache, dass es durch den Menschen immer schwiriger wird zu überleben).
Abgesehen davon, dass wir es mit dem Fortplanzen besser hin bekommen ist es insgesamt nicht besser geworden oder?