cards-deck: 100-199_university::111-120_theoretic_cs::111_algorithms_datastructures

(a,b)- Bäume | bei uns meist $(2, 4)$ -Bäume

anchored to [[111.00_anchor]] proceed from [[111.37_b_trees]]

Wir möchten uns eine weitere Form von Bäumen anschauen und diese definieren.

[!Definition] $(a, b)$ -Bäume. Was macht sie aus, welche 4 Eigenschaften müssen gelten? #card

Seien folgend $a, b \in N, a \geq 2, b \geq 2 a - 1$ >Dann nennen wir jetzt einen Baum $T$ $(a, b)$ -Baum, falls die folgenden vier Eigenschaften gelten:

alle Blätter haben die gleiche Tiefe ( also wenn wir ihn visuell betrachten, sind alle Blätter auf der “gleichen Ebene”)

alle inneren Knoten haben $\leq b$ Kinder –> innere Knoten sind die, die auf ihrer Höhe noch nachbarn haben!

alle Knoten (außer der Wurzel) haben $\geq a$ Kinder

Die Wurzel selbst hat $\geq 2$ Kinder

(2,4)-Bäume

Als spezielle bzw wichtige Grundstruktur möchten wir uns jetzt $(2, 4) -$ Bäume anschauen. Betrachten wir dabei eine Menge $S = {x_{1} < x_{2} < \dots < x_{n}}$ , welche wir jetzt in einem solchen Baum speichern möchten. ^1706629932940

[!Important] Wie gehen wir vor, um diese sortierte Menge entsprechend in den Baum einzufügen Wir speichern $S$ in den Blättern des Baumes und dabei immer von links nach rechts sortiert. Also im linkesten Blatt werden wir das kleinste Element $x_{1}$ haben und vice versa Ein innerer Knoten $v$ hat hierbei $d$ Kinder und weiterhin auch $s_{1}, \dots s_{d - 1}$ Schlüssel! Weiterhin nennen wir dann ein Element $s_{i}$ den Inhalt des rechtestens Blattes im $i$ -ten Unterbaum, den wir betrachten können. Wir müssen hier weiterhin das maximal Element von der Menge, also $x_{n}$ , in der Wurzel speichern

Wir können durch diese Konstruktion eines Baumes jetzt folgende Aussage über die Höhe treffen:

[!Important] Höhe eines $(2, 4)$ -Baumes wie können wir sie einschränken / beschreiben? #card Es gilt jetzt für die Höhe eines $2, 4$ -Baumes mit $n$ Blättern folgend: $\frac{1}{2} \cdot lo g n \leq h \leq lo g n$ ^1706629932948

Suchen / Einfügen

Auch hier sind die Operationen Suchen/Einfügen gleich, wie bei einem B-Baum!

[!Important] Sonderfall beim Einfügen eines Wertes in Knoten $w$ was müssen wir beachten bezüglich der Menge von Schlüsseln? Wie ist die Laufzeit davon? #card Wenn wir einen Knoten haben und nach dem Einfügen jetzt $5$ Kinder haben ( also $\neq = \leq b = 4$ ), dann müssen wir den Knoten $w$ wieder aufspalten und somit auf dessen Parent zugreifen, das Mittelelement $x_{j}$ nehmen und dann als Schlüssel deklarieren. Die beiden neuen Knoten $w^{'}$ und $w^{''}$ werden dann links und rechts vo n $x_{j}$ platziert! ![[Pasted image 20240125222132.png]] Die Laufzeit dieser Operation beträgt dabei $O (1 + ∣ Sp a lt u n g ∣)$ ^1706629932956

Entfernen

Wenn wir jetzt ein Element aus dem (2,4)-Baum entfernen möchten, müssen wir wieder bestimmte Dinge beachten, wie es auch bei B-Bäumen notwendig war.

[!Definition] Ablauf des Entfernens eines Inhaltes $a$ wie müssen wir vorgehen? welche 3 Fälle müssen wir unterscheiden? #card

Auch hier starten wir, indem wir das gesuchte Element mit Suche(a) suchen.

Haben wir dieses Element erhalten möchten wir drei Fälle unterscheiden:

$a$ steht auch im parent****, also $p a re n t (v) = w$ -> dann löschen**** wir $v$ und streichen es aus $w$

$a$ steht nicht im parent****, also $p a re n t (v) = w$ und ist somit das**** rechteste Kind ( weil ja Schlüssel offenbar kleiner sind ( sonst wäre es nicht da drin zu finden) . Sei dann weiter $v^{'}$ das linkere Kind von $v$ mit dem Schlüssel $s$ . Wir entfernen dann den Eintrag $a$

![[Pasted image 20240125223642.png]]

Es kann sein, dass w nur noch ein Kind hat. Dann können wir zwei vorgehen betrachten: vereinigen / balancieren mit Nachbarn

　 1. verschmelzen****: Dabei muss ein Geschwister von $w$ , also $v$ genau 2 Kinder haben********. Anschließend kann das einzige Element $w$ dann in den knoten übernommen werden****. Visuell folgend:

![[Pasted image 20240125223912.png]]

　 2. Ein Geschwister $v$ von $w$ hat $\geq 3$ Kinder –> also wir können versuchen aufzuspalten und zu balancieren!. Dann möchten wir jetzt folgendes machen: Wir nehmen das linkeste Element von $v$ und fügen es bei $w$ ein ( also den Schlüssel und dessen Teilbaum). Visuell folgend:

![[Pasted image 20240125224047.png]]

Die Laufzeit fürs Entfernen lässt sich dann auf $O (1 + ∣ Vereinigung ∣)$ zusammenführen. –> Teils müssen wir viel vereinigen / mal weniger!

Amortisierte Laufzeit vom (2,4)-Baum

Wir können aus der obigen Betrachtung heraus erkennen, dass hier die Laufzeit von diversen Operationen immer zwischen $O (1), O (lo g n)$ schwankt, weil diese vom Zustand des Baumes abhängig sind. Wir möchten daher jetzt eine amortisierte Analyse durchführen, um die Laufzeit entsprechend evaluieren zu können..

mögliches Vorgehen könne hierbei das Betrachten eines Bankkontos sein, in welchem wir bei: • schnellen Operationen einen Euro einzahlen –> somit Zeit gutschreiben! • teure Operationen ziehen wieder Geld ab –> etwa $lo g n €$ –> also sie machen den Gesamtwert wieder schlechter

Aus dieser Betrachtung heraus können wir dann evaluieren, wie schnell / gut unser System in Abhängigkeit von normalen Operationen sein wird / kann Dabei achten wir darauf, dass $T_{a c t u a l} + Δ B \leq T_{am or t i s i er t}$ , dass heist wir möchten upper boundaries finden. Dabei erhoffen wir uns natürlich $T_{a c t u a l} = O (1)$ Aus der obigen Konstruktion können wir jetzt folgende Zeit evaluieren / erzeugen:

[!Definition] amortisierte Kosten für Operationen: einfügen/löschen wie kommen wir auf die amortisierte Laufzeit, welche ist es? #card

Wir können folgern, dass in einem (2,4)-Baum die amortisierten Kosten zum einfügen / löschen in der Zeit von $O (1)$ verlaufen!

Beweisen können wir es folgend:

Wir wählen ein Potential ( in obigen Beispiel also einen Bankkonto-Betrag) und definieren es wie folgt:

$p o t (T) = 2 \cdot ∣ G r a d - n o d e_{1} ∣ + 1 \cdot ∣ G r a d - n oe d_{2} ∣ + 0 \cdot ∣ G r a d - n o d e_{3} ∣ + 2 \cdot ∣ G r a d - n o d e_{4} ∣ + 4 \cdot ∣ G r a d - n o d e_{5} ∣$

und bei dieser Konstruktion sehen wir, dass folgende Invarianten eintreten werden!

$p o t (T) \geq 0, \forall T$

Immer wenn wir die Operation zum spalten/vereinigen/reduzieren auf einen Knoten $v$ anwenden, werden dann die anderen Knoten eine Ordnung von 2,3,4 Kindern haben! -> sonst wäre die Operation nicht notwendig gewesen!

Vor dem Einfügen/Löschen sind immer alle Knoten in Ordnung ( also die Struktur ist valide!)

Es gilt hierbei jetzt also folgendes:

Die Unter-Operationen Spalten/Vereinigen/verringern werden mit Kosten von $O (1)$ beschrieben und es handelt sich dabei um deren tatsächlichen Kosten!

[!Info] betrachten wir die amortisierte Analyse vom Einfügen genauer: wie konstruieren wir die amortisierte Laufzeit, womit schließen wir ab? #card

Beim einfügen brauchen wir unter die Unter-Operationen: Spalten, wofür wir betrachten können, wie es das Potential ( also den Betrag des Bankkontos ) verringern kann.

Beim Spalten betrachten wir folgende Veränderung des Potentials: $w = 4 \to 0$ und weiter beim parent $p a re n t (w)$ steigt es um $\leq 2$ –> also ist es doch am sinken, weil die Nachteile die Vorteile überwiegen!

Es folgt weiterhin: amortisierte Laufzeit = tatsächliche Kosten + Potentialerhöhung

Also beim Einfügen:

tatsächliche Kosten 1 + Potentialerhöhung $\leq 2$

und für die Spalte-Operation: tatsächliche Kosten $f$ + Potentialerhöhung $\leq f$

wodurch wir jetzt folgend: $\leq 3$ resultieren werden

Für die Entfernen-Operationen verfahren wir hier analog!

Anwendung der Bäume | Sortieren von fast sortierten Listen

Angenommen wir haben jetzt eine fast sortierte Liste, die wir anschließend vollends sortieren möchten. Wie können wir das unter Anwendung von (2,4)-Bäumen sinnvoll machen? #card Prinzipiell möchten wir einen leeren Baum einfach fortlaufend mit den Elementen füllen, und lassen ihn sich selbst balancieren, wodurch wir keinerlei Aufwand haben. Wir werden hierbei logischerweise $m c d o t O (n lo g n) (S e a rc h)$ und weiterhin auch $n \cdot O (n) (in ser t)$ durchfüren. Die Operation der Suche ist relativ langsam, aber wir können sie in ihrer Geschwindigkeit verbessern –> das passiert automatisch, wenn wir eine etwas vorsortierte Menge haben( weil man dann einfacher durch den Baum traversieren bzw cachen kann). Betrachte dafür die Eingaben-Menge $X = {x_{1}, \dots, x_{n}}$ welche wir chronologisch einfügen möchten Weiterhin beschreibt $F = ∣ {(i, j) ∣ i < j \land x_{i} > x_{j}} ∣$ die Menge von Inversionen, die innerhalb dieser Folge auftreten kann –> also die Paare innerhalb der Menge, die in ihrer Sortierung verdreht sind Für diese Inversion gilt dann: $0 \leq F \leq \frac{n ^{2}}{2}$

[!Definition] Laufzeit vom Sortieren mit einem $(2, 4)$ Baum mit welcher Geschwindigkeit können wir das durchführen? Was sind wichtige Betrachtungen dafür? #card

Das Sortieren von einer fast sortierten Liste von Elementen ist mit (2,4)-Bäumen mit einer Laufzeit von $O (n lo g (\frac{F}{n} + 1))$ möglich, wobei wir mit $F$ die Menge von Inversionen( also falsch herum geordneten Elementen in der Eingabe) meinen

Das bedeutet dann folgende Laufzeiten, je nach $F$ !

$>> F >> F >> F >> F \approx n^{2} ⟹ T = O (n lo g n) \approx n ⟹ T = O (n) \approx n lo g n ⟹ T = O (n lo g lo g n) \approx n^{\frac{3}{2}} ⟹ T = O (n lo g n) >>$

Beweisen kann man das folgend: Sei $f_{i} = ∣ {j ∣ i < j \land x_{i} > x_{j}}$ dann können wir daraus die gesamte Menge von $F$ konstruieren mit

　 $F = i \sum f_{i}$

-> Wir fügen jetzt die Elemente in umgekehrter Reihenfolge in den Baum ein und fangen so etwa mit $x_{n}$ an.

Beim einfügen eines jeden Elements dieser Menge $x_{i}$ sind dann $x_{i + 1}, \dots x_{n}$ schon enthalten. Wir starten dann ganz links und laufen bis zur Wurzel, anschließend wieder nach unten -> entsprechen der Knoten und deren Schlüssel. Wenn jetzt $x_{i}$ relativ klein ist, läuft man sich weit bis zur Wurzel!

[!Important] PseudoCode zum sortieren eines (2,4) Baumes wie gehen wir vor? #card Das heißt als PseudoCode können wir das folgend beschreiben:

>traverse-Up(xi): >v = linkestes Blatt >while ( xi > Schlüssel(parent(v))) > v = parent(v) `>````

Wir traversieren also bis wir wissen, dass unser xi kleiner ist, als die betrachteten Schlüssel!

[!Tip] amortisierte Laufzeit zum Einfügen eines Elementes #card Die amortisierte Laufzeit zum Einfügen eines Elementes kostet uns $$\mathcal{O}(1+ \log f_{i})$$ Wir wissen bereits, dass das Einfügen sonst mit $\mathcal{O}(1)$ läuft. Wir müssen uns aber immer noch im Baum zurechtfinden ( also lokalisieren). Das machen wir ja jetzt durch das hochtraversieren, wobei wir dann zu einer Höhe $h$ kommen und anschließend unser neues Elemente nach den $f_{i}$-ten Elementen einfügen. Betrachten wir es visuell: Dafür beschreibt $v$ den Umkehrpunkt und $v’$ das linkeste Kind von $v$. Wir machen folgendes: ![[Pasted image 20240126123632.png]]

Es folgen jetzt Gesamtkosten von $$\sum\limits_{i=1}^{n} \mathcal{O}(1 + \log f_{i}) = \mathcal{O}\left( n + \sum\limits_{i=1}^{n} \log f_{i}\right) = \mathcal{O}\left( n + n \log \frac{F}{n} \right)$$ Was dann unserer Gesamtzeit zum sortieren entspricht! ^1706629932963

scattered-lenity