Datenbanken und Aussagesätze (BD 2015): Unterschied zwischen den Versionen
Anna (Diskussion | Beiträge) K (comment) |
Anna (Diskussion | Beiträge) K (→"the philosophy department's down the hallway": space) |
||
(2 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) | |||
Zeile 57: | Zeile 57: | ||
<br /> | <br /> | ||
− | C.J. Date: Introduction to Database Systems (Edition 6). 1994 | + | Für Date und Darwen sind Datenbanken Depots wahrer Sätze. Sie übernehmen die logische Rekonstruktion der Aussagen- und Prädikatenlogik und wenden sie auf die Datenbankkonstruktionen an. Dabei behandeln sie Informationsträger (Zeichen) so wie Gegenstände. In einer Sammlung von Briefmarken finden sich lauter Briefmarken und in einer Sammlung von Informationen lauter Informationen. Und zwar in dem Sinn, dass es '''zutreffende''' Informationen sind. |
+ | |||
+ | An den Briefmarken eines Albums kann man prüfen, ob es sich um Briefmarken handelt. Das Vorliegen eines Satzes ist dagegen keine Garantie dafür, dass die von ihm symbolisierte Tatsache besteht. Das Datenbank Management System kann die Beurteilung von Sachverhalten nicht übernehmen. | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | '''C.J. Date: Introduction to Database Systems (Edition 6). 1994''' | ||
<br /> | <br /> | ||
Zeile 72: | Zeile 78: | ||
[[Bild:date-propositions3.png|600px]] | [[Bild:date-propositions3.png|600px]] | ||
</p> | </p> | ||
+ | |||
+ | <br /> | ||
+ | |||
+ | Hier die wichtigen begrifflichen Festlegungen: | ||
+ | |||
+ | *every relation has an intended '''interpretation''' or '''meaning'''. | ||
+ | *users must be aware of those meanings, if they want to use the database effectively | ||
+ | *a relation has to be understood as a predicate | ||
+ | *a predicate is a truth-value function | ||
+ | *invoking this function yields a proposition | ||
+ | *propositions are either true or false | ||
+ | |||
+ | |||
+ | Und nun einige problematische Formulierungen: | ||
+ | |||
+ | *"And at any given time, of course, the relation contains exactly those tuples that make the predicate evaluate to '''true''' at that time." | ||
+ | *The DBMS should accept that tuple only if it does not cause the corresponding predicate to be violated (i.e. only if the corresponding proposition is not '''false'''). | ||
+ | *"...the predicate for a given relation constitutes the criterion for update acceptability for that relation - that is, the criterion for deciding whether or not some proposed update is in fact valid (or at least plausible) for the given relation." | ||
+ | *"Now, it is of course not possible for the DBMS to know '''exactly''' what the predicate is for a given relation ... the DBMS has no way of knowing '''a priori''' that the predicate is such" that tuple a makes it true and tuple b does not. | ||
+ | *"However, the DBMS certainly '''does''' know a reasonably close approximation to that predicate." | ||
== "the philosophy department's down the hallway" == | == "the philosophy department's down the hallway" == | ||
+ | |||
+ | <br /> | ||
'''Exzerpte aus [http://www.dcs.warwick.ac.uk/~hugh/M359/What-a-Database-Really-Is.pdf Hugh Darwen: What a Databasde ''really'' is: Predicates and Propositions]''' | '''Exzerpte aus [http://www.dcs.warwick.ac.uk/~hugh/M359/What-a-Database-Really-Is.pdf Hugh Darwen: What a Databasde ''really'' is: Predicates and Propositions]''' |
Aktuelle Version vom 3. Dezember 2015, 13:21 Uhr
Inhaltsverzeichnis
In Formen passen
Tabellen sind Ordnungskonstrukte. Es gibt sie schon lange und relationale Datenbanken sind dadurch gekennzeichnet, dass die in ihnen enthaltenen Tabellen mittels formaler Operationen erzeugt, bearbeitet und ausgewertet werden können. Die Tabelle der Lotteriegewinnerinnen ist eine geordnete Liste, welche die Ergebnisse einer Preisermittlung festhält. Wie ist der Charakter von Tabellen in Datenbanken allgemein zu beschreiben?
Ein illustratives Bild wäre ein Werkzeugkasten, der für verschiedene Werkzeuge passende Formen vorsieht. So wie auf den einen Platz ein Hammer, auf den anderen ein Schraubenzieher "gehört", sind unter "Leistung" und "Emissionen" die jeweiligen Werte einzutragen. Das nennt man Datenerhebung. Wie die im Raum verstreuten Werkzeuge in eigens dafür vorbereiteten Regalen "in Ordnung gebracht werden", werden Emissionswerte eingetragen.
Dieses Bild ist ernsthaft irreführend. Es legt folgende Verhältnisse nahe
- in eine schlichte Kiste kann man alles mögliche einfüllen
- eine dedizierte Werkzeugkiste ordnet die vorhandenen Geräte
- so ordnet auch ein Formular bestimmte Sachverhalte
Die Bruchstelle in diesem Zusammenhang liegt zwischen Geräten und Sachverhalten. Es scheint, als würden handgreifliche Gegenstände und Tatsachen gleich behandelt werden können. Geordnet aufbewahrt werden Dinge und -- was wird in einer Datenbank, die durch ein Formular "befüllt" wird, aufbewahrt?
Eine naheliegende Antwort ist Information. Datenbanken sind Informationsspeicher. zum Verständnis dieses Begriffes kann man noch hinter die im Bild auftretende Kiste zurückgreifen, die einen schlichten Behälter für Gerätschaften darstellt. Es gibt Getreidespeicher oder Energiespeicher, z.B. eine Batterie. Was unterscheidet eine Batterie von einer Datenbank? Die Antwort, dass die eine Elektrizität, die andere Informationen speichert, ist völlig unzureichend.
Den Grund des Ungenügens kann man oberflächlich oder analytischer formulieren:
- Tatsachen sind keine physischen Gegebenheiten. Man elektrisiert sich am Strom, nicht daran, dass Strom vorhanden ist. Man stolpert über einen Stein, nicht darüber, dass ein Stein im Weg liegt.
- Informationen sind semantische Gebilde. Ihre Besonderheit liegt in ihrem Verweisungscharakter. Sie teilen etwas mit. Die Einträge in einer Datenbank beziehen sich auf äußere Umstande. Sie speichern Informationen über sie.
Und wie sind diese Umstände zu fassen? Im Fall der Werkzeugkiste liegen die Geräte im Raum herum. Umstände sind nicht so verfügbar. Informationen werden, nach dem irreführenden Bild, "erhoben", als ob sie vorfindlich wären wie Geräte. Der Vorgang ist anders. Sie werden nach einem vorgegebenen Muster eingeholt. Die Inhalte von Datenbanken sind Zusammenstellungen von Einträgen in einer bestimmten Form. Informationen werden formuliert. Im Gegensatz zu Werkzeugen sollen sich diese Einträge auf eine Außenwelt beziehen. Dieses Problem hat eine Batterie nicht. In einem Sinn bezieht sich die Batterie natürlich auf die Außenwelt. Sie ist dazu da, in ein Elektrogerät eingesetzt zu werden um Strom abzugeben. Aber dieser Sinn macht auch deutlich, wie andersartig der Umgang mit gespeicherten Informationen ist. Das beginnt bei der Formulierung. Nach welchen Kriterien werden Informationen in die Datenbank aufgenommen?
Informationen werden eingeholt besagt: Es ist bekannt, wonach gesucht wird, und wenn es gefunden ist, wird es in einem Eintrag fixiert. Ein Datenbankeintrag gibt Attribute vor, nach denen in der Umwelt zu suchen ist und konfiguriert Zeichen für Träger dieser Attribute zu Ausdrücken. Dieser Vorgang entspricht dem Verfahren, das in der klassischen Erkenntnistheorie und Sprachphilosophie beschrieben wird. Menschen unterliegen massenhaften Sinneseindrücken und finden sich zurecht, indem sie Abstraktionen ausbilden, um der unübersichtlichen Umwelt Herr zu werden. Das Basisinstrument dafür sind Sätze. In ihnen werden (tentativ) Sachverhalte zusammengestellt und beurteilt. Ein Satz ist wahr oder falsch, je nachdem seine Behauptung akzeptiert wird, oder nicht. (Die Bedingungen dieser Akzeptanz interessieren uns an dieser stelle nicht.)
Es liegt daher nahe, Datenbankeinträge als Sätze zu verstehen und sie mit wahr und falsch in Zusammenhang zu bringen. Ihre Sätze speichern Information, die dadurch gekennzeichnet ist, dass sie den Test der Behauptung erfolgreich bestanden hat. Batterien sind Energiespeicher, indem sie im Gebrauch funktionieren. Datenbanken sind Wahrheitenspeicher, sofern ihre Einträge auf tatsächlich bestehende Konfigurationen von Umständen verweisen.
Hier entsteht eine Schwierigkeit, die weder bei Batterien, noch bei Werkzeugen auftritt, in erkenntnistheoretischen und semantischen Zusammenhängen dagegen unvermeidbar ist. (Gespeicherte) Zeichen sind nicht das Bezeichnete, auf das sie sich beziehen. Sie weisen darauf hin, das heißt auch, dass das Bezeichnete entfernt oder verlorengegangen sein kann. Zwischen dem Bezeichneten, welches ein Zeichen ins Gespräch bringt, und dem Bezeichneten, dem diese Diskussion gilt, ist ein Unterschied zu machen. Traditionell epistemologisch ist das der Unterschied zwischen Vorstellungen und dem Vorgestellten. Im Fall von Datenbanken kann man eine "Datenwelt" annehmen, die genau aus jenen Umständen besteht, welche die Einträge nahelegen. Davon verschieden ist die Welt, deren Beschaffenheit wir zur Beurteilung möglicher Datenbankeinträge heranziehen.
Wohlgeformt, aber wahr?
Für Date und Darwen sind Datenbanken Depots wahrer Sätze. Sie übernehmen die logische Rekonstruktion der Aussagen- und Prädikatenlogik und wenden sie auf die Datenbankkonstruktionen an. Dabei behandeln sie Informationsträger (Zeichen) so wie Gegenstände. In einer Sammlung von Briefmarken finden sich lauter Briefmarken und in einer Sammlung von Informationen lauter Informationen. Und zwar in dem Sinn, dass es zutreffende Informationen sind.
An den Briefmarken eines Albums kann man prüfen, ob es sich um Briefmarken handelt. Das Vorliegen eines Satzes ist dagegen keine Garantie dafür, dass die von ihm symbolisierte Tatsache besteht. Das Datenbank Management System kann die Beurteilung von Sachverhalten nicht übernehmen.
C.J. Date: Introduction to Database Systems (Edition 6). 1994
Hier die wichtigen begrifflichen Festlegungen:
- every relation has an intended interpretation or meaning.
- users must be aware of those meanings, if they want to use the database effectively
- a relation has to be understood as a predicate
- a predicate is a truth-value function
- invoking this function yields a proposition
- propositions are either true or false
Und nun einige problematische Formulierungen:
- "And at any given time, of course, the relation contains exactly those tuples that make the predicate evaluate to true at that time."
- The DBMS should accept that tuple only if it does not cause the corresponding predicate to be violated (i.e. only if the corresponding proposition is not false).
- "...the predicate for a given relation constitutes the criterion for update acceptability for that relation - that is, the criterion for deciding whether or not some proposed update is in fact valid (or at least plausible) for the given relation."
- "Now, it is of course not possible for the DBMS to know exactly what the predicate is for a given relation ... the DBMS has no way of knowing a priori that the predicate is such" that tuple a makes it true and tuple b does not.
- "However, the DBMS certainly does know a reasonably close approximation to that predicate."
"the philosophy department's down the hallway"
Exzerpte aus Hugh Darwen: What a Databasde really is: Predicates and Propositions
Hello. Let me introduce myself. My name is Hugh Darwen, and I am the tutor (staff number 44525) in region 4 for certain students on course M358, which is entitled Relational Databases.
- 3 Sätze
- "The first, "Hello," is a mere signal, establishing contact."
- "The second is in the form of an imperative, demanding something of you, the reader (though of course we all know that it's really just a common courtesy in this particular instance)."
- "The third is a plain statement of fact."
- 3 Sätze
...
How do we distinguish statements of fact from other kinds of sentences, such as greetings, imperatives, and questions? Well, here's another example that might help:
- I am writing this article in my study at home in Warwickshire on February 9th,1997.
Now, you cannot tell whether what I've just told you is a true statement of fact or a false one, but you do know, from its very form, that it is either true or false. By contrast, we cannot say of utterances such as "Hello," "Let me introduce myself," or "What's the time?" that they must be either true or false.
...
A DATABASE IS A SET OF TRUE PROPOSITIONS
It's useful to view a database as representing a set of propositions (assumed to be true ones) concerning some enterprise of which the database is supposed to provide some kind of record (I'm using the term record here in its generic sense, not the special sense in which it's often used in computer contexts—in database contexts in particular). If we do take that view, there are some important questions that immediately arise:
- How do we choose which propositions should be stated to form the record of our enterprise?
- In what form should those propositions be stated?
- How can we instruct the computer to remember or forget a given proposition or set of propositions?
- Can we get the computer to prevent us from stating propositions that are ridiculous or contradictory? A ridiculous proposition might be one that states that a certain person is 200 years old; contradictory ones might state that a person is both male and female, or that a tutor in region 4 is—contrary to Open University rules—tutoring a student inregion 5.
- In what form can we present a question (or "query") to the computer, the response to which would be a proposition or a set of propositions derived by logic from a given database? And in what form should we expect to find that response?"
...
PREDICATES
- First, logicians from Aristotle onwards found that reasoning based just on the notion of propositions had certain severe limitations, which they eventually overcame by studying certain generalized forms of such propositions. They found that, when several propositions are of the same generalized form, various impressive shortcuts could be taken by reasoning in terms of those general forms instead of in terms of individual propositions per se.
- Second, commercial databases can contain billions of propositions; if propositions of the same general form cannot somehow be lumped together, such databases will surely be unmanageable and unusable.
...
It's predicates that have made databases, database management, and database queries tractable to computerization. Consider once again the proposition from my opening paragraph, which I'll now restate in a very slightly different way:
- Hugh Darwen is the name of a tutor (staff number 44525) in region 4 for certain students on course M358, which is entitled Relational Databases.
It's easy to see that this statement has a certain form that could be common to a whole set of propositions one might wish to state in some record of the enterprise called the Open University.
...
Here's what is probably the most general form of the original proposition that we might all agree on:
- ... is the name of a tutor (staff number ... ) in region ... for certain students on course ... , which is entitled ... .
And that's a predicate!
heute gehen donauinsel
- Eine Aneinanderreihung von Worten, vergleichbar "hüte geben adonai sel"
- Aber was ist mit "gestern fahren prater" und "bald laufen donaukanal"
- Es kann sich ein Muster ergeben. Wie in einem Intelligenztest
Quelle: Plakos
- Ein Muster wird wahrgenommen, entdeckt, geprüft, weitergeführt, formalisiert.
Termin | Transport | Ort |
---|---|---|
heute | gehen | donauinsel |
woche | fliegen | Frankfurt |
In der skizzierten Abfolge lassen sich einige zentrale philosophische Fragen kennzeichnen:
- Was sind beliebige Wortfolgen? Lärm (Informationstheorie)? Symptome (Psychoanalyse)? Abstraktionen (Phänomenologie)?
- Was wird aus diesen Wortfolgen, wenn sie zu einem Muster in Beziehung gesetzt werden? Was "sind" sie vor und nach dieser Operation?
- Welchen Charakter gewinnt eine Wortfolge durch Eingabe in eine Datenbank?
- Sie passt zu den Attributen (sinnvoll, wohlgeformt).
- Sie bindet die Attribute in einem Eintrag zusammen.
- Der Eintrag organisiert eine Anzahl von Attributen zu einem Ganzen.
- Was ist dieses Ganze? Eine Beurteilungseinheit.
- Was macht eine Beurteilungseinheit aus? Sie unterliegt der Prüfung auf wahr oder falsch.
Es liegt im Begriff des Erfahrungsmusters, dass es ausgehend von einzelnen Gegebenheiten wahrgenommen und durch Wiederholung bestätigt wird. Regularitäten treten auf und werden bemerkt. Als Regularitäten können sie nur bemerkt werden, wenn auftretende Impulse als zugehörig zu anderen Impulsen bewertet werden. Der tägliche Heimweg folgt einem Muster und unterliegt einer Kontrolle. Wenn er ein Heimweg sein soll, kann sich das gewohnte Muster als unpassend erweisen. Die Charakterisierung "Heimweg" legt ein Beurteilungskriterium über das Muster, wie die Kategorien "Fingerabdruck" oder "Weltkarte" über entsprechende Bilder. (Es könnte sich auch um keinen Abdruck eines Fingers handeln, sondern um ein Bild, das so aussieht, wie ein Fingerabdruck.)