- Iterator
-
Der Begriff Iterator stammt aus dem Bereich der Softwareentwicklung und bezeichnet einen Zeiger, mit dem über die Elemente einer Liste bzw. durch die Elemente einer Menge iteriert werden kann. Der Iterator wird insbesondere im Bereich der Datenbanken manchmal auch Cursor genannt.
Inhaltsverzeichnis
Beschreibung
Externe Iteratoren und das Iterator-Entwurfsmuster
→ Hauptartikel: Iterator-Entwurfsmuster
Ein externer Iterator kann als eine Art Zeiger betrachtet werden, der zwei primäre Funktionen besitzt: Ein bestimmtes Element in einer Menge von Objekten referenzieren (element access genannt), sowie durch selbst-Modifizierung auf das nächste Element in der Menge zu zeigen (element traversal genannt). Abhängig von der verwendeten Programmiersprache und der Anwendung können Iteratoren zusätzliche Funktionalität, sowie verschiedenes Verhalten aufweisen.
Der Hauptzweck des Iterators ist es, dem Benutzer zu erlauben, auf jedes Element in einer Menge zuzugreifen, während es ihn von der Datenstruktur der Menge isoliert. Dies befähigt die Menge, die Elemente auf jede mögliche Art und Weise zu verwalten, während sie sich dem Benutzer gegenüber so verhält, als wäre sie eine simple Sequenz oder eine Liste. Eine Iteratorklasse wird in enger Koordination mit ihrer Containerklasse, also ihrer Menge, entworfen. Üblicherweise stellt die Containerklasse die Funktionen zur Verfügung, die zur Erstellung von Iteratoren benutzt werden. Ein Zähler in einer Schleife (auch loop Counter genannt) wird manchmal auch als Schleifeniterator bezeichnet. Dabei ist zu beachten, dass ein solcher Zähler nur die element traversal Funktionalität abbildet und nicht die element access Funktionalität.
Generatoren
→ Hauptartikel: Generator
Eine Art, Iteratoren zu implementieren, ist es, eine spezielle Funktion zu erstellen, welche als Generator bekannt ist. Diese kann, anstatt ein Element auf einmal zurückzuliefern, mehrere Elemente in mehreren Schritten dem Benutzer zurückliefern. Die meisten Iteratoren lassen sich in natürlicher, intuitiver Art und Weise durch Generatoren abbilden. Da Generatoren ihren lokalen Status zwischen Funktionsaufrufen beibehalten, eignen sie sich hervorragend zur Implementierung von komplexen zustandsorientierten Iteratoren wie sogenannte Binärbaumtraversierer. Als Beispiel sei hier ein Generator angeführt, welcher Zahlen einer Fibonacci-Folge mit Hilfe des Pythonbefehls yield zurückliefert:
def fibonacci(): a, b = 0, 1 while True: yield a a, b = b, a+b for number in fibonacci(): # Benutze den Generator als Iterator print(number)
Implizite Iteratoren
Mehrere Objektorientierte Sprachen wie Perl, Python, C#, Ruby sowie neuere Java-und Delphiversionen stellen eine intrinsiche Art durch Elemente zu iterieren zur Verfügung, ohne dabei ein explizites Iteratorobjekt zu benutzen. Dieses kann allerdings auch vorhanden sein ist aber nicht im Code der jeweiligen Programmiersprache verfügbar, wenn dies der Fall sein sollte.
Implizite Iteratoren manifestieren sich oft durch den foreach Befehl oder seine Äquivalente wie unten stehendes Python Beispiel zeigt:
for value in iterable: print(value)
Manchmal werden Iteratoren auch direkt vom Objekt der Datensammlung generiert wie unten stehendes Ruby-Beispiel zeigt:
iterable.each do |value| puts value end
Dieser Iterationsstil wird auch internal iteration genannt da sein Code vollständig im Kontext des zu iterierenden Objektes ausgeführt wird. Dieses kontrolliert somit sämtliche Aspekte der Iteration, der jeweilige Benutzer respektive Programmierer, stellt nur die Operation für die einzelnen Iterationsschritte zur Verfügung indem er eine anonyme Subroutine benutzt.
Sprachen welche sogenannte list comprehensions oder ähnliche Konstrukte unterstützen, bedienen sich analog zu Python ebenfalls der impliziten Iteratoren während der Erstellung der Resultatsliste:
names = [person.name for person in roster if person.male]
Manchmal ist die implizite, versteckte Natur nur teilweise vorhanden. Die Programmiersprache C++ stellt die for_each Funktionalität über Funktionstemplates zur Verfügung, diese erlaubt die implizite Iteration.
Der Gegensatz zum Indexieren
Der Iterator steht dabei im Gegensatz zu einem Index oder Schlüssel:
- Über einen Iterator kann man direkt auf das zugehörige Element zugreifen ohne die Datenstruktur selber zu kennen. Bei einem Index benötigt man immer Index und Datenstruktur.
- Ein Iterator ist nur für genau eine Datenstruktur gültig. Ein Index kann auf andere Datenstrukturen übertragen werden.
- Iteratoren lassen sich nicht serialisieren. Sie müssen dazu erst zu einem Index gewandelt werden.
Die Fähigkeit eines Containers der Selbst-Modifizierung während durch seine Elemente iteriert wird, hat sich in modernen, objektorientierten Programmiersprachen als wichtig erwiesen. Die Zwischenbeziehungen zwischen den einzelnen Objekten und der Effekte ihrer Operationen sind in solchen Sprachen nicht mehr eindeutig. Um dieses Problem zu lösen werden Iteratoren eingesetzt.
Iteratoren in verschiedenen Programmiersprachen
C++
Die Programmiersprache C++ setzt Iteratoren im großen Stil ein und stellt über der Standard Template Library Iteratoren verschiedener Typen wie sogenannte forward iterators, bidirectional iterators, und random access iterators zur Verfügung. Jede der Standard-Containerklassen besitzt ein reichhaltiges und konsistentes Angebot an Iteratortypen. Die Syntax der Standarditeratoren wurde an der Zeigerarithmetik von C angelehnt. Die
*
und->
Operatoren werden zur Referenzierung der Elemente benutzt, weitere Operatoren wie++
werden benutzt um durch die Elemente zu navigieren.Iteratoren werden üblicherweise paarweise eingesetzt. Der eine Iterator stellt die aktuelle Iteration dar, während der andere das Ende der Iteration darstellt. Die Iteratoren werden von der entsprechenden Containerklasse durch die Benutzung der Standardfunktionen
begin()
undend()
generiert. Der Iterator der durchbegin()
zurückgegeben wird zeigt auf das erste Element, während der Iterator der vonend()
zurückgegliefert wird auf einen speziellen Wert zeigt welcher kein Element referenziert. Wenn ein Iterator hinter das letzte Element gesetzt wird, gibt dieser den speziellen Wert vonend()
zurück. Das folgende Beispiel zeigt die typische Verwendung eines Iterators in C++:ContainerType C; // Ein beliebiger Standard-Containertyp, wie std::list<sometype> for (ContainerType::const_iterator constIt = C.begin(); constIt != C.end(); ++constIt) { std::cout << *constIt << '\n'; }
Es existieren viele verschiedene Iteratortypen mit leicht voneinander abweichendem Verhalten. Nicht jeder Iteratortyp unterstützt jeden Containertyp. Es ist allerdings für den Programmierer möglich eigene Iteratortypen zu definieren in dem sie eine Klasse vom Template
std::iterator
ableiten. Die Iteratorsicherheit ist für die verschiedenen Typen separat definiert. Die implizite Iteration ist in C++ teilweise vorhanden und wird von den Funktionenstd::for_each()
,std::copy()
undstd::accumulate()
zur Verfügung gestellt. Iteratoren benötigen allerdings immer ein explizites Objekt zu ihrer Initialisierung, üblicherweise diejenigen welche vonbegin()
undend()
zurückgegeben werden. Sobald diese ausgeführt wurde geschieht die Iteration auf implizite Weise ohne das Iteratorobjekt weiter zu benutzen. Das unten stehende Beispiel zeigt die Verwendung von for_each:ContainerType<ItemType> C; // Ein beliebiger Standard-Containertyp jedes ItemType Elements void ProcessItem( const ItemType& I ) // Funktion welche Zugriff auf jedes Element besitzt { std::cout << I << '\n'; } std::for_each(C.begin(), C.end(), ProcessItem); // Eine for-each Iterationsschleife
Dasselbe kann durch den Einsatz von
std::copy
undstd::ostream_iterator
erreicht werden:std::copy(C.begin(), C.end(), std::ostream_iterator<ItemType>(std::cout, "\n"));
Eine Einschränkung dieser Technik ist, dass es dem Rumpf nicht erlaubt inline deklariert zu sein. Zudem benötigt dies einen Funktionszeiger welcher an anderer Stelle deklariert werden muss und als Parameter übergeben werden muss. Dies kann teilweise durch die Benutzung von Bibliotheken wie Boost und der Anwendung von lambda kompensiert werden die gebraucht werden um Funktionsobjekte mit verwandter Infix Syntax zu generieren. Da diese Funktionalität nur über externe Bibliotheken zur Verfügung gestellt wird müssen diverse Problemumgehungen, auch Workarounds genannt, eingesetzt werden.
C# und andere .NET Sprachen
Iteratoren im .NET Framework werden als Enumeratoren bezeichnet und von der Schnittstelle
IEnumerator
repräsentiert.IEnumerator
stellt eine Funktion namensMoveNext()
zur Verfügung, die jeweils zum nächsten Element der Menge geht und anzeigt wenn das Ende erreicht ist, sowie eine Eigenschaft namensCurrent
, um den Wert des aktuellen Elementes zu erhalten. Des Weiteren wird eine optionalereset
Funktion angeboten, um an den Anfang zurückzukehren. Der Enumerator gibt als Initialisierungswert einen speziellen Wert zurück, der den Anfang markiert; aus diesem Grund ist es nötig, nach der InitialisierungMoveNext()
auszuführen.Enumeratoren werden typischerweise von einer
GetEnumerator()
Funktion zurückgegeben, welche einem Objekt zugehörig ist, das dieIEnumerable
Schnittstelle implementiert. Der foreach Befehl in C# operiert allerdings auf jeder solchen Funktion, selbst wenn diese nicht von einem Objekt stammt, welches dieIEnumerable
Schnittstelle implementiert. Das folgende Beispiel zeigt eine simple Verwendung von Iteratoren in C# 2.0:// explizite Version IEnumerator<MyType> iter = list.GetEnumerator(); while (iter.MoveNext()) Console.WriteLine(iter.Current); // implizite Version foreach (MyType value in list) Console.WriteLine(value);
C# 2.0 unterstützt ebenfalls Generatoren: eine Funktion welche als
IEnumerator
oder alsIEnumerable
zurückkehrt, aber den Befehlyield return
dabei benutzt, wird vom Compiler automatisch in eine neue Klasse umgewandelt, welche die angemessene Schnittstelle implementiert.Java
Die java.util.Iterator Schnittstelle, welche im Java JDK 1.2 release eingeführt wurde, erlaubt das Iterieren von Containerklassen. Jeder
Iterator
stellt Funktionen namens next(), hasNext() sowie eine optionale Funktion namens remove() zur Verfügung. Iteratoren werden üblicherweise von einer Funktion namensiterator()
generiert, welche von der dementsprechenden Containerklasse zur Verfügung gestellt wird. Ein Iterator gibt als Initialisierungwert einen speziellen Wert zurück, der den Anfang markiert. Aus diesem Grund ist es nötig nach der Initialisierungnext()
auszuführen, womit das erste Element zurückgegeben wird. DiehasNext()
Funktion wird dazu benutzt, um herauszufinden, wann das letzte Element zurückgegeben wird. Das folgende Beispiel zeigt eine simple Verwendung von Iteratoren in Java:Iterator iter = list.iterator(); //Iterator<MyType> iter = list.iterator(); in J2SE 5.0 while (iter.hasNext()){ System.out.println(iter.next()); }
Für Kollektionen, die es unterstützen, entfernt die optionale
remove()
Funktion das letzte Element, auf das zugegriffen wurde. Die meisten anderen Modifikationen dieser Art sind unsicher. Zusätzlich besitzt java.util.List einen Iterator namens java.util.ListIterator, welcher eine ähnliche Schnittstelle zur Verfügung stellt, die Vorwärts- und Rückwärtsiteration erlaubt sowie den Index des aktuellen Elementes zurückgibt und das Element an einer gegebenen Position einfügen kann.Mit dem J2SE 5.0 release wurde die Iterable Schnittstelle eingeführt, welche eine erweiterte for-Schleife im Sinne von foreach darstellt.
Iterable
definiert die iterator() Funktion, welche einenIterator
zurückliefert. Mit der Benutzung der erweiterten for-Schleife kann das vorhergehende Beispiel auf folgende Art und Weise geschrieben werden:for (MyType obj : list){ System.out.print(obj); }
Ruby
Die Implementation der Iteratoren in Ruby unterscheidet sich von den meisten anderen Programmiersprachen: Alle Iterationen gehen dem Gedanken nach, sogenannte callback closures an Containermethoden durchzureichen. Auf diese Art und Weise implementiert Ruby nicht nur eine Basisfunktionalität an Iteratoren, sondern bildet viele Iteratorentwurfsmuster ab wie z.B. sogenanntes function mapping, Filter und sogenanntes reducing.
Ruby unterstützt des Weiteren noch eine alternative Syntax Für jede Basisfunktion zur Iteration:
(0...42).each do |n| puts n end
...und...
for n in 0...42 puts n end
oder noch kürzer
42.times do |n| puts n end
Python
Iteratoren in python stellen einen fundamentalen Teil der Sprache dar, allerdings werden sie vielfach implizit und somit unsichtbar in Sprachbefehlen versteckt genutzt. Solche Befehle sind z.B.
for
(foreach) in sogenannten list comprehensions und in Generatorausdrücken. Alle sequentiellen Basistypen sowie viele Klassen der Standardbibliothek in Python unterstützen Iterationen. Das folgende Beispiel zeigt eine typische Iteration über einer Sequenz:for value in sequence: print(value)
Python Dictionaries, eine Form von Assoziativem Array erlaubt es direkt über sich zu iterieren wenn die sogenannten dictionary keys zurückgegeben werden. Es kann aber auch über die items Funktion eines dictionary iteriert werden wo es die Werte dem nachfolgenden Beispiel entsprechend zu key und value zurückgibt:
for key in dictionary: value = dictionary[key] print(key, value)
for key, value in dictionary.items(): print(key, value)
Iteratoren in Python können aber auch explizit definiert und benutzt werden. Für jeden iterierbaren Sequenztypen oder jede iterierbare Klasse steht die eingebaute
iter()
Funktion zur Verfügung um ein Iteratorobjekt zu generieren. Mit dem Iteratorobjekt kann mit den Funktionennext()
, oder__next__()
zum nächsten Element navigiert werden. Ist das Ende der Menge erreicht wird einStopIteration
Fehler aufgeworfen. Das nachfolgende Beispiel zeigt eine Äquivalente Implementation von expliziten Iteratoren:it = iter(sequence) while True: try: value = it.next() except StopIteration: break print(value)
Jede benutzerdefinierte Klasse kann die Standarditeration unterstützen wenn eine
_iter__()
Funktion definiert wurde welche ein Iteratorobjekt generiert, der Iterator muss dann eine__next__()
Funktion definieren die das nächste Element zurückgibt. Die Python-Generatoren implementieren dieses Iterationsprotokoll.PHP
Mit PHP4 wurde ein
foreach
Konstrukt eingeführt das ähnlich wie in Perl und vielen anderen Programmiersprachen aufgebaut war. Diese Konstrukt erlaubt eine einfache Art über Arrays zu iterieren. Derforeach
Befehl funktioniert nur mit Arrays in PHP4 und wird einen Fehler aufwerfen wenn versucht wird ihn über einen anderen Datentyp oder einer uninitialisierten Variable zu benutzen. In PHP5 ist derforeach
Befehl zur Iteration über alle public members erlaubt. Das folgende Beispiel zeigt zwei unterschiedliche Schreibweisen, die zweite ist eine nützliche Erweiterung zur ersten Schreibweise:Beispiel A
<?php foreach (array_expression as $value) echo "$value\n"; ?>
Beispiel B
<?php foreach (array_expression as $key => $value) echo "($key)$value\n"; ?>
Im Beispiel A wird über ein Array welches von array_expression dargestellt wird iteriert. Bei jedem Schleifendurchlauf wird der Wert des Arrayelementes an
$value
zugewiesen sowie der interne Zeiger des Arrays um eins nach vorne geschoben. Somit wird beim nächsten Schleifendurchlauf das nächste Arrayelement zurückgegeben. Das Beispiel B besitzt dieselbe Funktionalität wie das Beispiel A. Zusätzlich wird der Index des Elementes bei jedem Schleifendurchlauf der Variable$key
zugewiesen.In PHP5 ist die Iteratorschnittstelle vordefiniert, Objekte können verändert werden um die Iteration handzuhaben.
<?php class MyIterator implements Iterator { private $var = array(); public function __construct($array) { if (is_array($array)) { $this->var = $array; } } public function rewind() { echo "rewinding\n"; reset($this->var); } public function current() { $var = current($this->var); echo "current: $var\n"; return $var; } public function key() { $var = key($this->var); echo "key: $var\n"; return $var; } public function next() { $var = next($this->var); echo "next: $var\n"; return $var; } public function valid() { $var = $this->current() !== false; echo "valid: {$var}\n"; return $var; } } ?>
Diese Funktionen werden alle in einer kompletten
foreach($obj AS $key=>$value)
sequenz genutzt. Die Iteratormethoden werden in der folgenden Reihenfolge ausgeführt:1. rewind() 2. while valid() { 2.1 current() in $value 2.3 key() in $key 2.4 next() }
MATLAB
MATLAB unterstützt externe sowie interne Iteratoren. Im Falle einer externen Iteration, bei welcher der Benutzer dazu verpflichtet ist das nächste Element bereitzustellen, können mehrere Elemente definiert werden und mit einer for-Schleife anschließend durchgelaufen werden wie folgendes Beispiel zeigt:
% Definition eines an integer arrays myArray = [1,3,5,7,11,13]; for n = myArray % ... etwas mit n machen... disp(n) %Integerausgabe zur Kommandozeile end
Im Falle einer internen Iteration kann der Benutzer eine Operation dem Iterator übergeben um auf jedes Element in einem Array zuzugreifen. Viele nativen Operatoren und MATLAB Funktionen werden überladen um ein korrespondierendes Ausgabearray als impliziten Rückgabewert zu erhalten. Des weiteren können die Funktionen
arrayfun
undcellfun
für Benutzerdefinierte Operationen über native und sogenannte cell Arrays gebraucht werden.function simpleFun % Definition eines an integer arrays myArray = [1,3,5,7,11,13]; % Benutzerdefinierte Operation für jedes Element durchführen myNewArray = arrayfun(@(a)myCustomFun(a),myArray); % %Arrayausgabe zur Kommandozeile myNewArray function outScalar = myCustomFun(inScalar) % Mit 2 multiplizieren outScalar = 2*inScalar;
Alternativerweise kann es wünschenswert sein die Speichermechanismen des Arrays vom Programmieren wegzuabstrahieren indem eine benutzerdefinierte, objektorientierte Implementation des Iteratorentwurfsmusters zur Verfügung gestellt wird. Eine Solche Implementation welche die externe Iteration unterstützt, wird im MATLAB Central File Exchange item Entwurfsmuster : Iterator (Verhalten) zur Schau gestellt. Dieses Entwurfsmuster ist nach der neuen Klassendefnitionssyntax geschrieben welche mit der MATLAB Version 7.6 (R2008a) eingeführt wurde. Des weiteren ist eine eindimensionale cell Array Realisierung des List Abstract Data Type enthalten um eine heterogene Speicherung jedes Datentyps vorzunehmen. Es stellt die Funktionalität zur Verfügung um eine Liste mit
hasNext()
,next()
undreset()
in einer while Schleife zu verarbeiten.Weitere Artikel
Weblinks
- Understanding and Using Iterators von Joshua Gatcomb (engl)
- A Technique for Generic Iteration and Its Optimization (engl)
- STL Iterators (engl)
- What are iterators? (engl) -Referenzbeschreibung (engl)
- Java Interface
- .NET Interface
- Boost C++ Iterator Library (engl)
- PHP: Object Iteration (engl)
Wikimedia Foundation.