Lowlevel

Ich denke am einfachsten wäre es, wenn jemand einfach mal ein "Problem" in den Raum stellt. Daran kann man dann am besten diskutieren welche Variante die beste ist.

Als Testlauf würde ich vorschlagen das ein Programm eine Datei komplett in den Speicher lesen möchte, also OPEN, GET_SIZE, READ und CLOSE. Die Datei soll dabei 300MBytes groß sein. Schwierigkeiten sind dabei der unbekannt lange Dateiname (aus Sicht des VFS unbekannt) und die große Datenmenge beim Lesen. Das Programm macht intern (nach dem GET_SIZE) einfach ein malloc mit der Dateigröße und dann ein einzelnes fread um die gesamte Datei auf einen Schlag einzulesen. Beschrieben werden sollte wie das IPC-System diese Wünsche an das VFS übermittelt und wie die Funktionen (fopen/fstat/fread/fclose) in der libc ungefähr arbeiten (also die IPC benutzen), alles was unter dem VFS steckt interessiert hier mal nicht.
Wenn das Szenario Okay ist stelle ich gerne meine Lösung vor.

Mir fallen als grobe Methoden erstmal synchrones und asynchrones Message-Handling, Pipes, Signal-Handler und Shared-Memory ein.

Bezüglich Deiner Definition von synchronem Message-Handling fehlt dann noch (als Steigerung) richtiges Message-basiertes RPC, also wo der Client nicht nur wartet bis der Service seine Anfrage bearbeitet sondern solange wartet bis er auch seine Antwort vom Service bekommt. Als weiteres Kriterium kommt dann noch ob das übermitteln der Antwort wieder ein eigenständiger IPC-Vorgang ist oder ob das alles Teil eines komplexeren RPC-Vorgangs ist.

Als weiterer Vorteil wird oft genannt das man die Nachrichten nicht hin und her kopieren muss, das stimmt so aber nicht. Denn man muss die Daten ja aus einem Thread in den nächsten kopieren.

Wieso sollte das nicht ohne kopieren gehen? Ich hab doch nebenan genau erläutert wie es auch komplett ohne kopieren geht.

Ein Thema was für beide (synchron/asynchron) zutrifft, ist ob man sich für feste oder dynamisch Lange Nachrichten entscheidet.

Aber das ist ein lösbares Problem.

Zu Signal-Handlern kann ich gar nichts sagen, da ich sowas noch nie verwendet habe und was ich davon weiß auch nicht sonderlich begeistert bin

Ich persönlich bin auch der Meinung dass das klassische Signal-Handler-Konzept, von Unix, für richtiges IPC eher ungeeignet ist. Wie das ausgeht sieht man ja bei tyndur. Sorry an die tyndur-Macher aber von dieser IPC-Methode ist IMHO wirklich nicht viel zu halten.

Zitat von: erik.vikinger am 28. August 2010, 16:26

Pipe´s kann man gut als Mittel verwendet wenn es darum geht Daten dynamischer Länger zu übermitteln

Aber bei Byte-orientierten Pipes muss man gut aufpassen das Sender und Empfänger nie uneins werden wo Nachrichten anfangen und aufhören, man benötigt also ein gutes (komplexes) Kommunikations-Protokoll.

Grüße
Erik

FlashBurn · « **Antwort #4 am:** 28. August 2010, 16:56 »

Zitat von: erik

Bezüglich Deiner Definition von synchronem Message-Handling fehlt dann noch (als Steigerung) richtiges Message-basiertes RPC, also wo der Client nicht nur wartet bis der Service seine Anfrage bearbeitet sondern solange wartet bis er auch seine Antwort vom Service bekommt.

Ähm, das habe ich bei mir mit dem Syscall "send+recv" und nem Flag das man auf die Antwort des Empfängers warten will.

Zitat von: erik

Wieso sollte das nicht ohne kopieren gehen? Ich hab doch nebenan genau erläutert wie es auch komplett ohne kopieren geht.

Um das Thema auch für weniger wissende interessant zu machen, würde ich sagen das wir deine Hardware-Architektur mal außen vor lassen

Die Mehrheit der heute vorhandenen Architekturen kennt keine richtigen Segmente mehr.
Und wenn du keine Segmente hast, dann musst du ja in irgendeiner Form kopieren. Einzige Möglichkeit ohne kopieren auszukommen, wäre auf einer Architektur ohne MMU (auch das dürfte für uns nicht so interessant sein).

Zitat von: erik

Aber bei Byte-orientierten Pipes muss man gut aufpassen das Sender und Empfänger nie uneins werden wo Nachrichten anfangen und aufhören, man benötigt also ein gutes (komplexes) Kommunikations-Protokoll.

Bitte genauer erklären was du meinst, da ich dir nicht genau folgen kann, am besten an einem Bsp.

Zu dem Bsp. möchte ich mal noch meinen, das es ziemlich schlechter Programmierstil wäre eine 300MB Datei per fread in einem Ritt zu laden. Zumal du dir ja ein schönes Bsp ausgesucht hast, was deine Architektur ja bevorzugt (da es keinen Unterschied für dich macht ob du 3MB oder 300MB per Segment einblendest)

Also ich sage jetzt mal das ich das alles über Pipe´s löse (da bin ich mir aber noch nicht 100% sicher). Bei der Initialisierung der libc (oder dem 1. benutzen von Dateifunktionen) macht man sich mit dem Storage-Server 2 Pipe´s aus, eine zum Senden und eine zum Empfangen.

Dann "stellst" du eine Nachricht zusammen, die halt aus dem MsgCode für OPEN besteht und dem String für den Dateinamen.
Als Rückgabewerte bekommst du dann den ErrorCode (0 falls alles in Ordnung war) sowie den Dateihandle (ne einfache Nummer),
Für GET_SIZE dann wieder das gleiche Spiel, MsgCode halt für GET_SIZE und noch den Dateihandle.
Als Rückgabewerte halt wieder ErrorCode und die Size.
READ wird dann schon interessanter. Man stellt halt wieder eine Nachricht zusammen, MsgCode von READ und dann noch den Dateihandle und halt wieviel man von wo an lesen möchte. (An dieser stelle möchte ich mal anmerken, das es sinnvoller wäre von fread hier zu entscheiden, die Datei irgendwie per SharedMem zu lesen, bzw. einzublenden)
Die Daten kommen dann halt per Pipe und müssen in den von malloc allokierten Bereich kopiert werden. Wenn alles optimal läuft (auf einem SMP System) dann kann das sogar halbwegs gleichzeitit ablaufen (sprich der Storage-Server schreibt in die Pipe und auf der anderen CPU kann fread gleichzeitig aus der Pipe lesen).

Da ich aber ja gerade versuche ne neue Pipe (siehe früherer Post) zu implementieren, würde ich die "kleinen" Sachen (wie MsgCode, Dateihandle, Errorcode) per Msg verschicken und nur sowas wie Dateinamen und die Daten die zu lesen sind per Pipe.

kevin · « **Antwort #5 am:** 28. August 2010, 17:00 »

Als Testlauf würde ich vorschlagen das ein Programm eine Datei komplett in den Speicher lesen möchte, also OPEN, GET_SIZE, READ und CLOSE. Die Datei soll dabei 300MBytes groß sein. Schwierigkeiten sind dabei der unbekannt lange Dateiname (aus Sicht des VFS unbekannt) und die große Datenmenge beim Lesen. Das Programm macht intern (nach dem GET_SIZE) einfach ein malloc mit der Dateigröße und dann ein einzelnes fread um die gesamte Datei auf einen Schlag einzulesen. Beschrieben werden sollte wie das IPC-System diese Wünsche an das VFS übermittelt und wie die Funktionen (fopen/fstat/fread/fclose) in der libc ungefähr arbeiten (also die IPC benutzen), alles was unter dem VFS steckt interessiert hier mal nicht.
Wenn das Szenario Okay ist stelle ich gerne meine Lösung vor.

Klingt okay, außer dass ich den ganzen Stack anschauen würde. Das heißt, die Kommunikation mit dem Dateisystem und dem Blockgerät auch noch mit reinnehmen. Dann hat man nämlich auch noch eine Situation drin, in der ein Treiber Daten weiterreichen muss (bzw. umgangen werden muss, wenn man das nicht will).

Etwas üblicher als der 300-MB-Request wären viele kleine Requests - und gleichzeitig sind die kleinen Requests auch gemeiner, weil sie den Kommunikationsoverhead deutlicher sichtbar machen. Aber vom Prinzip her ist es natürlich dasselbe, insofern keine Einwände gegen das Szenario an dieser Stelle.

Zitat

Ich persönlich bin auch der Meinung dass das klassische Signal-Handler-Konzept, von Unix, für richtiges IPC eher ungeeignet ist. Wie das ausgeht sieht man ja bei tyndur.

Man erhält unter den Betriebssystemen der Lowlevel-Community das fortgeschrittenste?

tyndur ist jetzt nicht unbedingt instabiler als andere Hobbysysteme, die ich so gesehen habe. Das Konzept hat seine Probleme, aber ich hätte tyndur jetzt eher nicht als Beispiel zitiert, dass es in die Katastrophe führen muss.

erik.vikinger · « **Antwort #6 am:** 28. August 2010, 21:35 »

Hallo,

außer dass ich den ganzen Stack anschauen würde. Das heißt, die Kommunikation mit dem Dateisystem und dem Blockgerät auch noch mit reinnehmen. Dann hat man nämlich auch noch eine Situation drin, in der ein Treiber Daten weiterreichen muss (bzw. umgangen werden muss, wenn man das nicht will).

Das mit dem weiterreichen der Daten ist in einem Micro-Kernel-OS natürlich ein gewichtiges Argument, weil es wohl nur wenige Dinge gibt die sich mit nur einer einzigen Ebene erledigen lassen, das würde ich in das Szenario gerne mit aufnehmen. Man könnte noch einen Datei-System-Treiber und einen SATA/IDE-Treiber dazu nehmen, das wäre ein gutes Szenario. Caching sollten wir aber der Einfachheit halber erstmal außen vor lassen.

Etwas üblicher als der 300-MB-Request wären viele kleine Requests - und gleichzeitig sind die kleinen Requests auch gemeiner, weil sie den Kommunikationsoverhead deutlicher sichtbar machen. Aber vom Prinzip her ist es natürlich dasselbe, insofern keine Einwände gegen das Szenario an dieser Stelle.

Die Anzahl der Aktionen ist mir eigentlich egal, ich denke man sieht auch bei einem einzelnen Vorgang wo z.B. mehr Kontext-Wechsel nötig sind, wenn das bei einem Konzept aus irgendeinem Grund nicht linear nach oben skaliert dann muss das natürlich extra erklärt werden. Die große Datenmenge hab ich absichtlich gewählt damit man zeigen muss wie gut die Daten von einem Prozess zum nächsten kommen (hier wäre auch wieder das Durchreichen über mehrere Ebenen interessant). Ich denke mal 300MBytes sind noch nicht so viel das meine Segmente da den extremen Vorteil bringen (wir können aber auch gerne auf 128MBytes runter gehen), mit 4MBytes-Pages kann man das noch mit vertretbaren Aufwand von einem Flat-Memory-Prozess in den nächsten mappen, günstiges Alignment können wir mal annehmen auch wenn man drauf hinweisen sollte das ungünstiges Alignment Performance kostet.

Man erhält unter den Betriebssystemen der Lowlevel-Community das fortgeschrittenste?

Hä, was meinst Du den mit diesem Satz?

tyndur ist jetzt nicht unbedingt instabiler als andere Hobbysysteme, die ich so gesehen habe. Das Konzept hat seine Probleme, aber ich hätte tyndur jetzt eher nicht als Beispiel zitiert, dass es in die Katastrophe führen muss.

Ich wollte in keinster Weise tyndur als instabil oder gar untauglich abstempeln sondern nur sagen das tyndur ein ungünstiges (aber trotzdem funktionierendes) IPC-Konzept verwendet.

Zitat von: erik
Bezüglich Deiner Definition von synchronem Message-Handling fehlt dann noch (als Steigerung) richtiges Message-basiertes RPC, also wo der Client nicht nur wartet bis der Service seine Anfrage bearbeitet sondern solange wartet bis er auch seine Antwort vom Service bekommt.
Ähm, das habe ich bei mir mit dem Syscall "send+recv" und nem Flag das man auf die Antwort des Empfängers warten will.

Das ist ein wichtiges Detail das durchaus mit erwähnt werden muss.

Und wenn du keine Segmente hast, dann musst du ja in irgendeiner Form kopieren.

Nein, man kann auch in MMU-basierten Falt-Memory-Systemen einfach mal eine größere Menge an Daten von einem Prozess in einen anderen mappen. Man sucht sich dazu einfach in dem Ziel-Prozess einen passenden freien Block im virtuellen Adressraum und mappt dort die selben Pages des physischen Speichers rein wie in dem Quell-Prozess. Wenn man eine größere Menge an Pages verarbeiten muss ist das zwar langsamer als mit meinen Segmenten aber trotzdem nicht unmöglich, und so groß dürfte der Performance-Vorteil meiner Segmente nun auch wieder nicht sein, schon weil ich dafür einen komplexeren Speicher-Manager brauche (ich gehe davon aus das ich bei sehr kleinen Datenmengen, z.B. unter 4kBytes, immer kopieren werde weil das Kopieren dann doch schneller ist als das erstellen eines erbenden Segments).

Zitat von: erik
Aber bei Byte-orientierten Pipes muss man gut aufpassen das Sender und Empfänger nie uneins werden wo Nachrichten anfangen und aufhören, man benötigt also ein gutes (komplexes) Kommunikations-Protokoll.
Bitte genauer erklären was du meinst, da ich dir nicht genau folgen kann, am besten an einem Bsp.

Naja, man muss eben auf beiden Seiten aufpassen das man keine Message fehlerhaft dekodiert ansonsten verliert man die Synchronisation. Wenn man da z.B. ein fehlertolerantes Protokoll benutzen möchte bringt das eben wieder etwas zusätzliche Komplexität ins Spiel.

Zu dem Bsp. möchte ich mal noch meinen, das es ziemlich schlechter Programmierstil wäre eine 300MB Datei per fread in einem Ritt zu laden.

Wieso, was ist daran schlechter Programmierstiel dem OS klar zu sagen das ich viele Daten lesen will anstatt dem OS etliche male zu sagen (lügen) das ich nur wenige Daten lesen will? Mal vom zusätzlichen Kommunikationsoverhead vieler Anfragen abgesehen.

Zumal du dir ja ein schönes Bsp ausgesucht hast, was deine Architektur ja bevorzugt (da es keinen Unterschied für dich macht ob du 3MB oder 300MB per Segment einblendest)

Gönne mir doch den kleinen Vorsprung.

(da bin ich mir aber noch nicht 100% sicher)

Du darfst auch gerne mehrere Szenarien vorstellen, vielleicht können wir Dir helfen die jeweiligen Vorteile und Nachteile besser gegenüber zu stellen.

Bei der Initialisierung der libc (oder dem 1. benutzen von Dateifunktionen) macht man sich mit dem Storage-Server 2 Pipe´s aus, eine zum Senden und eine zum Empfangen.

Benötigt man dieses Pipe-Paar ein mal pro Prozess oder ein mal pro Thread? Kann man über ein Pipe-Paar verschiedene Dinge parallel/verschachtelt erledigen?

Dann "stellst" du eine Nachricht zusammen, die halt aus dem MsgCode für OPEN besteht und dem String für den Dateinamen. ...

Okay, hab ich verstanden. Das bedeutet das Du in jedem Prozess je einen Thread benötigs um die Kommunikation aufrecht zu erhalten auch wenn mal gerade nichts kommuniziert wird. Wenn sehr viele Programme auf Deinem OS laufen die alle mal auf Dateien zugegriffen haben würde das auch bedeuten das in Deinem "Storage-Server" eine ziemlich große Anzahl an Threads nutzlos schläft und Speicher verbraucht.

An dieser stelle möchte ich mal anmerken, das es sinnvoller wäre von fread hier zu entscheiden, die Datei irgendwie per SharedMem zu lesen, bzw. einzublenden

Wenn Du Dir davon ein Vorteil versprichst dann nur zu. Erkläre dann eben wie Du Dir einen Lesevorgang für eine ordentlich große Datenmenge vorstellst so das die Daten in dem an fread übergebenen Buffer ankommen. Wir könnten jetzt auch ein anderes Szenario nehmen wo es um Memory-Mapped-Datei-Zugriff geht aber das hätte ja nicht mehr viel mit IPC zu tun, schließlich ist IPC unser aktuelles Thema.

Wenn alles optimal läuft (auf einem SMP System) dann kann das sogar halbwegs gleichzeitit ablaufen (sprich der Storage-Server schreibt in die Pipe und auf der anderen CPU kann fread gleichzeitig aus der Pipe lesen).

Das heißt Du möchtest für einen Vorgang gleich 2 CPUs belegen?

Grüße
Erik

FlashBurn · « **Antwort #7 am:** 28. August 2010, 22:33 »

Zitat von: erik

Nein, man kann auch in MMU-basierten Falt-Memory-Systemen einfach mal eine größere Menge an Daten von einem Prozess in einen anderen mappen. Man sucht sich dazu einfach in dem Ziel-Prozess einen passenden freien Block im virtuellen Adressraum und mappt dort die selben Pages des physischen Speichers rein wie in dem Quell-Prozess.

Wo wir schon bei einem interessantem Punkt wären. Wenn man Nachrichten mit dynamischer Länge hat, könnte man sagen, das man ab 4kb nicht mehr die Daten kopiert, sondern Pages einblendet.
Die Frage wäre jetzt nur was passiert mit den Pages beim Sender? Ich meine normalerweise werden die Daten ja kopiert oder besser gesagt kannst du als Sender davon ausgehen, wenn du zurück vom Syscall kommst, dass du mit den Daten machen kannst was du willst. Wenn man aber die Pages in einem anderen Prozess einblendet, dann kannst du das nicht mehr einfach so machen.
Eine Lösung wäre COW (copy-on-write).

Zitat von: erik

Naja, man muss eben auf beiden Seiten aufpassen das man keine Message fehlerhaft dekodiert ansonsten verliert man die Synchronisation. Wenn man da z.B. ein fehlertolerantes Protokoll benutzen möchte bringt das eben wieder etwas zusätzliche Komplexität ins Spiel.

Die würde ich halt in den Bibliotheken verstecken.

Zitat von: erik

Wieso, was ist daran schlechter Programmierstiel dem OS klar zu sagen das ich viele Daten lesen will anstatt dem OS etliche male zu sagen (lügen) das ich nur wenige Daten lesen will? Mal vom zusätzlichen Kommunikationsoverhead vieler Anfragen abgesehen.

Ich würde sowas nicht per fread machen sondern die Datei direkt in meinen Prozess mappen lassen (was wohl daran liegt, dass das wohl wesentlich effizienter und schneller sein sollte, auf allen Betriebssystemen).

Wie wäre es denn wenn mal jemand sagen würde wie das unter Windows oder Linux (oder sonst einem OS) gemacht wird?

Zitat von: erik

Benötigt man dieses Pipe-Paar ein mal pro Prozess oder ein mal pro Thread? Kann man über ein Pipe-Paar verschiedene Dinge parallel/verschachtelt erledigen?

Ich bin im Moment für pro Thread, weil du meine Pipe´s nicht wie klassische Pipe´s benutzen kannst. Betrachte sie eher wie eine definierte Kommunikation über SharedMem.

Was meinst du mit dem parallel/verschachtelt erledigen? Also wie gesagt, meine Pipe ist keine Pipe im klassischen Sinne.

Zitat von: erik

Okay, hab ich verstanden. Das bedeutet das Du in jedem Prozess je einen Thread benötigs um die Kommunikation aufrecht zu erhalten auch wenn mal gerade nichts kommuniziert wird. Wenn sehr viele Programme auf Deinem OS laufen die alle mal auf Dateien zugegriffen haben würde das auch bedeuten das in Deinem "Storage-Server" eine ziemlich große Anzahl an Threads nutzlos schläft und Speicher verbraucht.

It´s not a bug, it´s a feature

Ich bin mir gerade nicht sicher was du damit meinst das ich in jedem (User-) Prozess einen Thread brauche um die Kommunikation aufrecht zu erhalten.
Was die Threads in den Servern betrifft, ja.

Aber wenn viele Programme laufen können, die viele Dateien öffnen, dann hat der PC auch genug Power und RAM um das bewältigen zu können.

Zitat von: erik

Das heißt Du möchtest für einen Vorgang gleich 2 CPUs belegen?

So wie du das "sagst" klingt das so negativ

Ich will darauf hinaus, das die Daten, in meinem Fall, ja in eine Pipe kopiert werden und daraus auch wieder rauskopiert werden müssen. Am optimalsten wäre es halt wenn das ganze Gleichzeitig stattfinde würde. Dann müssten auch keine Kontextwechsel stattfinden, sondern der Storage-Server kann immer schön in die Pipe kopieren und der Client kann zur gleichen Zeit schön aus der Pipe kopieren, so werden die Daten ohne Kontextwechsel in den Client kopiert.

Ein weiterer Vorteil ist, das meine Methode auch bei knappen virtuellem Speicher funktionieren.

Ich wäre dann auch mal an einer Lösung interessiert wie man die Daten aus dem Server in den Clienten (über IPC) bekommt bzw. wie du/andere es halt besser machen würden.

Anders gefragt, wie machen es denn bekannte/weniger bekannte Mikrokernel?

Edit::

Was mir gerade so durch den Kopf geht. Wenn ich es richtig verstanden habe, dann soll ja beim synchronen Msg-Handling an sich nichts kopiert werden (oder besser im Kernel zwischengespeichert werden), aber wo sind die Daten denn? Wenn sie auf dem Stack sind, auf welchem User oder Kernel? Falls auf dem Userstack, wie bekommt ihr sie da von einem Prozess zum nächsten? Denn normalerweise kann man den Userspace von einem anderen Prozess ja nicht "sehen".

FlashBurn · « **Antwort #8 am:** 29. August 2010, 09:29 »

Auf Grund von erik´s Fragen, habe ich das mit der Pipe nochmal durchdacht und habe den Code von oben wieder verworfen (zumindest größtenteils). Was ich übernommen habe, ist das man immer in "Wörtern" (auf einer 32bit CPU also 4byte) in die Pipe schreibt und auch aus ihr liest.

Das Problem mit dem Code war, das es nicht möglich war eine Nachricht mit mehreren Aufrufen an "pipeLightRead" zu holen, das habe ich mit meinem aktuellem Code gelöst.

Wäre toll wenn ihr den mal kommentieren könnte, sprich ob das ne gute Idee oder eher ne schlechte ist!

Code: [Auswählen]

#define PIPELIGHT_STATUS_READER_WAITING 0x1
#define PIPELIGHT_STATUS_WRITER_WAITING 0x2

struct pipeLightKernel_t {
	uint32t numPages;
	struct list_t *pages;
	struct sem_t reader;
	struct sem_t writer;
};

struct pipeLight_t {
	uint32t size;
	uint32t volatile numWords2Read;
	uint32t volatile flags;
	uint32t volatile ptrRead;
	uint32t volatile ptrWrite;
	uint32t data[];
}

void pipeLightReaderWait(struct pipeLightKernel_t *pipe, struct pipeLight_t *pipeUser) {
	if(pipeUser->numWords2Read == 0) {
		if(pipe->writer.count < 0)
			semRelease(&pipe->writer);
		
		pipe->flags|= PIPELIGHT_STATUS_READER_WAITING;
		
		semAcquire(&pipe->reader);
		
		pipe->flags&= ~PIPELIGHT_STATUS_READER_WAITING;
	}
}

void pipeLightReaderFlush(struct pipe_t *pipe) {
	if(pipe->flags & PIPELIGHT_STATUS_WRITER_WAITING)
		pipeLightWriterWakeup(pipe);
}

void pipeLightReaderWakeup(struct pipeLightKernel_t *pipe) {
	semRelease(&pipe->reader);
}

void pipeLightWriterWait(struct pipeLightKernel_t *pipe, struct pipeLight_t *pipeUser) {
	if(pipeUser->numWords2Read == pipeUser->size) {
		if(pipe->reader.count < 0)
			semRelease(&pipe->reader);
		
		pipe->flags|= PIPELIGHT_STATUS_WRITER_WAITING;
		
		semAcquire(&pipe->writer);
		
		pipe->flags&= PIPELIGHT_STATUS_WRITER_WAITING;
	}
}

void pipeLightWriterFlush(struct pipeLightKernel_t *pipe) {
	if(pipe->flags & PIPELIGHT_STATUS_READER_WAITING)
		pipeLightReaderWakeup(pipe);
}

void pipeLightWriterWakeup(struct pipeLightKernel_t *pipe) {
	semRelease(&pipe->writer);
}

void pipeLightReader(struct pipeLight_t *pipe, uint32t *buffer, uint32t count) {
	while(true) {
		if(!count)
			break;
		
		//if there is no data, go into the kernel and wait for the writer to wake us up
		while(pipe->numWords2Read == 0)
			pipeLightReaderWait(pipe);
		
		*buffer= pipe->data[ptrRead];
		
		atomicSub(&pipe->numWords2Read,1);
		buffer++;
		count--;
		
		if(++ptrRead == pipe->size)
			ptrRead= 0;
	}
	
	pipeLightReaderFlush(pipe);
}

void pipeLightWriter(struct pipeLight_t *pipe, uint32t *buffer, uint32t count) {
	while(true) {
		if(!count)
			break;
	
		//if there is no free mem to write to, go into the kernel and wait for the reader to wake us up
		while(pipe->numWords2Read == pipe->size)
			pipeLightWriterWait(pipe->data);
			
		pipe->data[ptrWrite]= *buffer;
		
		atomicAdd(&pipe->numWords2Read,1);
		buffer++;
		count--;
		
		if(++ptrWrite == pipe->size)
			ptrWrite= 0;
	}
	
	pipeLightWriterFlush(pipe->data);
}

erik.vikinger · « **Antwort #9 am:** 29. August 2010, 09:57 »

Hallo,

Wo wir schon bei einem interessantem Punkt wären. Wenn man Nachrichten mit dynamischer Länge hat, könnte man sagen, das man ab 4kb nicht mehr die Daten kopiert, sondern Pages einblendet.

Ganz genau.

Die Frage wäre jetzt nur was passiert mit den Pages beim Sender?

Der Client würde blockieren, Du hast doch extra das send+recv dafür. Wenn Du von asynchronen IPC schreibst dann wäre kopieren vielleicht grundsätzlich die bessere Variante, den bei rein asynchronem IPC werden ja wohl eher kleine Infos übermittelt (Prozess X ist gekillt worden, Datei Y hat sich verändert oder IRQ Z ist aufgetreten).

Ich würde sowas nicht per fread machen sondern die Datei direkt in meinen Prozess mappen lassen (was wohl daran liegt, dass das wohl wesentlich effizienter und schneller sein sollte, auf allen Betriebssystemen).

Ich bezweifle dass das per Memory-Mapped-File-I/O schneller geht. Nehmen wir mal an wir haben ein Programm das die Datei komplett einlesen und verarbeiten will, als simples Beispiel nehmen wir mal md5sum. Wenn man das per Mapping (in einem Flat-Memory-System mit MMU) macht dann gibt es nur für jede Page eine Excpetion (der Exception-Handler holt dann das entsprechende Stück der Datei in den Speicher), weil das Programm ja linear von vorne nach hinten durch geht. Die ganzen Exceptions erzeugen ein Haufen überflüssigen Overhead. Wenn die Datei von dem Programm immer wieder oder nur teilweise verarbeitet/verändert wird (z.B. bei einer Datenbank) dann ist Mapping klar im Vorteil. Aber wir wollen ja in diesem Thread über IPC diskutieren, für Memory-Mapped-File-I/O darfst Du gerne einen neuen Thread aufmachen aber da dürften nur wenige mit diskutieren denn in welchem Hobby-OS steckt schon Memory-Mapped-File-I/O.

Ich bin mir gerade nicht sicher was du damit meinst das ich in jedem (User-) Prozess einen Thread brauche um die Kommunikation aufrecht zu erhalten.

Ich meinte, wenn auf dem Computer 50 Programme laufen und jedes mal kurz auf eine Datei zugegriffen hat (eine Config-Datei oder was ähnliches) dann laufen (oder eher schlafen) in Deinem Storage-Server 50 Threads und verbrauchen Speicher. Ich finde das irgendwie ungeschickt.

Aber wenn viele Programme laufen können, die viele Dateien öffnen, dann hat der PC auch genug Power und RAM um das bewältigen zu können.

Oder der PC würde es eigentlich gerade so schaffen wird aber mit Deinem Konzept dann doch in die Knie gezwungen (swapping usw.).

Zitat von: erik.vikinger am 29. August 2010, 09:57

Zitat von: erik
Das heißt Du möchtest für einen Vorgang gleich 2 CPUs belegen?
So wie du das "sagst" klingt das so negativ

Das sollte auch negativ klingen, Du versuchst das überflüssige und teure Kopierern billiger zu machen in dem Du 2 CPUs gleichzeitig beschäftigst. Der richtige Weg wäre IMHO das Kopieren möglichst ganz zu vermeiden.

Grüße
Erik

kevin · « **Antwort #10 am:** 29. August 2010, 11:30 »

Der Client würde blockieren, Du hast doch extra das send+recv dafür. Wenn Du von asynchronen IPC schreibst dann wäre kopieren vielleicht grundsätzlich die bessere Variante, den bei rein asynchronem IPC werden ja wohl eher kleine Infos übermittelt (Prozess X ist gekillt worden, Datei Y hat sich verändert oder IRQ Z ist aufgetreten).

Was ist mit asynchronem I/O? Also im Sinn von "schreib mal diese 300 MB (

) raus und gib mir dann einen Callback, aber ich mach solang schonmal was anderes"?

Zitat

Das sollte auch negativ klingen, Du versuchst das überflüssige und teure Kopierern billiger zu machen in dem Du 2 CPUs gleichzeitig beschäftigst. Der richtige Weg wäre IMHO das Kopieren möglichst ganz zu vermeiden.

Solange das Szenario fread ist, musst du mindestens einmal kopieren, um das nötige Alignment zu bekommen, damit du einfach Pages mappen kannst. Wenn ich es richtig verstanden habe, haben deine Segmente auch gewisse Alignmentvorgaben, insofern hast du dann genau dasselbe Problem.

FlashBurn · « **Antwort #11 am:** 29. August 2010, 11:45 »

Zitat von: taljeth

Solange das Szenario fread ist, musst du mindestens einmal kopieren, um das nötige Alignment zu bekommen, damit du einfach Pages mappen kannst. Wenn ich es richtig verstanden habe, haben deine Segmente auch gewisse Alignmentvorgaben, insofern hast du dann genau dasselbe Problem.

Wenn ich dich jetzt richtig verstanden habe, dann würdest du halt aus der 1. Page alles in eine neue Page kopieren und diese dann anstatt der originalen mappen und das selbe eventuell mit der letzten Page nochmal?

Da wären wir dann wieder da, das ich sage, nur fixed size Msgs und alles andere über meine Pipe´s bzw. wenn es z.B. mehr als 4MB sind, dann macht man das per SharedMemory.

Ich würde dann sozusagen die Komplexität an die User Programme (bzw. die Bibliotheken) weiterreichen.

Was ich in dem Sinne auch noch nicht habe, was passiert eigentlich wenn der empfangende Prozess nicht genug freien virtuellen Speicher hat um die Nachricht zu mappen?

kevin · « **Antwort #12 am:** 29. August 2010, 11:54 »

Zitat von: taljeth am 29. August 2010, 11:30

Wenn ich dich jetzt richtig verstanden habe, dann würdest du halt aus der 1. Page alles in eine neue Page kopieren und diese dann anstatt der originalen mappen und das selbe eventuell mit der letzten Page nochmal?

Vermutlich schon, ja. Aber wenn wir mal kurz von den 300 MB Abstand nehmen, die sicher nicht der Durchschnittsfall sind, dann machen die erste und die letzte Page wahrscheinlich häufig den Großteil oder sogar den ganzen Request aus.

Zitat

Was ich in dem Sinne auch noch nicht habe, was passiert eigentlich wenn der empfangende Prozess nicht genug freien virtuellen Speicher hat um die Nachricht zu mappen?

Dann gibt es halt einen Fehler zurück. Dasselbe wie wenn der Empfänger weggesegfaultet ist oder anderweitig nicht in der Lage ist, Nachrichten zu verarbeiten.

FlashBurn · « **Antwort #13 am:** 29. August 2010, 12:08 »

Zitat von: taljeth

Dann gibt es halt einen Fehler zurück. Dasselbe wie wenn der Empfänger weggesegfaultet ist oder anderweitig nicht in der Lage ist, Nachrichten zu verarbeiten.

Das war mir klar, aber was passiert mit der Nachricht, bleibt die in der Queue und muss durch einen extra Syscall gelöscht werden oder passiert das gleich?

Auch wäre dann interessant woher man weiß das der Sender auf eine Antwort wartet, denn man muss ihm ja bescheid geben, das der Empfänger die Nachricht nicht entgegen nehmen konnte (da ist dann synchron wieder im Vorteil). Bei mir ist das wieder durch ein Flag gekennzeichnet, das der Sender auf eine Antwort wartet.

Zitat von: taljeth

Vermutlich schon, ja. Aber wenn wir mal kurz von den 300 MB Abstand nehmen, die sicher nicht der Durchschnittsfall sind, dann machen die erste und die letzte Page wahrscheinlich häufig den Großteil oder sogar den ganzen Request aus.

Da wäre dann das optimalste, wenn du alles in eine oder zwei neue Pages kopierst und diese dann mappst. Dann ersparst du dir zumindest den 2. Kopiervorgang.

erik.vikinger · « **Antwort #14 am:** 30. August 2010, 12:19 »

Hallo,

Was ist mit asynchronem I/O? Also im Sinn von "schreib mal diese 300 MB () raus und gib mir dann einen Callback, aber ich mach solang schonmal was anderes"?

Also bei asynchronem IPC hab ich mir das so vorgestellt das der Service die geerbten Speicher-Bereiche so lange behalten darf bis der PopUp-Thread sich beendet oder diese Speicher-Bereiche explizit freigibt. Das bedeutet natürlich das der Client so lange nichts in diesem Speicher verändern darf aber das ist bei asynchronem File-I/O ja so üblich. Bei meinem Konzept müsste der VFS-Server dafür ein zweites Message-Target erstellen (also einen zweiten Port öffnen) um darüber dann asynchrones IPC empfangen zu können.

Zitat von: taljeth am 29. August 2010, 11:30

Solange das Szenario fread ist, musst du mindestens einmal kopieren, um das nötige Alignment zu bekommen, damit du einfach Pages mappen kannst. Wenn ich es richtig verstanden habe, haben deine Segmente auch gewisse Alignmentvorgaben, insofern hast du dann genau dasselbe Problem.

Naja, ich erkaufe mit das nicht Kopieren müssen damit das ich das Alginment nicht ganz einhalte. Ich denke maximal 15 Bytes vorne und hinten sind verschmerzbar, seht Ihr das anders? Wenn ja, warum?

Wenn ich dich jetzt richtig verstanden habe, dann würdest du halt aus der 1. Page alles in eine neue Page kopieren und diese dann anstatt der originalen mappen und das selbe eventuell mit der letzten Page nochmal?

Bei sehr großen Datenmengen dürfte sich das auf jeden Fall lohnen. Bei sehr kleinen Datenmengen ist kopieren wohl eh die effizientere Wahl.

Da wären wir dann wieder da, das ich sage, nur fixed size Msgs und alles andere über meine Pipe´s bzw. wenn es z.B. mehr als 4MB sind, dann macht man das per SharedMemory.

Ich finde "fixed size Msgs" klingt nach wenigen kBytes, von da bis zu den 4MBytes ist ein weites Feld, was machst Du mit Datensätzen in diesem Größen-Bereich? Das Shared-Memory muss aber auch wieder erst initiiert werden und damit bekommst Du dann für eine einzelne Funktionalität (in diesem Fall fread) mehrere verschiedene Wege und damit mehr Komplexität (im fread genauso wie in Deinem Storage-Server).
Eine meiner Hauptmotivationen für mein IPC-Konzept ist das ich nur einen einzigen Mechanismus haben will der für alle Größen optimal funktioniert. Das ich im Kernel kopiere, bei sehr kleinen Datensätzen, macht weder für den Client noch für den Service einen Unterschied, die merken das gar nicht und haben immer das selbe Interface zur Verfügung.

Ich würde dann sozusagen die Komplexität an die User Programme (bzw. die Bibliotheken) weiterreichen.

Womit diese Komplexität trotzdem nicht weg ist und eben immer noch CPU-Takte kostet (und in jedem Prozess etwas Code-Speicher belegt).

Zitat von: taljeth am 29. August 2010, 11:54

Was ich in dem Sinne auch noch nicht habe, was passiert eigentlich wenn der empfangende Prozess nicht genug freien virtuellen Speicher hat um die Nachricht zu mappen?

Das ist in der Tat ein Problem, aber das gibt es auch noch an anderen Stellen in Flat-Memory-Systemen. Mit meinen Segmenten hab ich dieses Problem glücklicherweise nicht, also hab ich noch nie über entsprechende Lösungen nachgedacht.

Aber wenn wir mal kurz von den 300 MB Abstand nehmen, die sicher nicht der Durchschnittsfall sind

Ich wollte eben einfach einen IPC-Fall der mal eine größere Menge an Daten überträgt, den Fall mit den sehr wenigen Daten stellt ja schon fstat dar (und fopen für die unbekannte Message-Größe beim Dateinamen+Path). Wenn Ihr einen anderen Wert für die Größe haben wollt dann gerne aber es wäre schön wenn wir uns dann mal einigen könnten damit wir ein einheitliches Szenario haben an dem wir über IPC diskutieren können.

Grüße
Erik

FlashBurn · « **Antwort #15 am:** 30. August 2010, 13:03 »

Zitat von: erik

Ich finde "fixed size Msgs" klingt nach wenigen kBytes, von da bis zu den 4MBytes ist ein weites Feld, was machst Du mit Datensätzen in diesem Größen-Bereich? Das Shared-Memory muss aber auch wieder erst initiiert werden und damit bekommst Du dann für eine einzelne Funktionalität (in diesem Fall fread) mehrere verschiedene Wege und damit mehr Komplexität (im fread genauso wie in Deinem Storage-Server).

Da ich mein Msg-System noch nicht wirklich nutzen muss, bin ich mir mit der Größe noch nicht sicher, aber im Moment sind es gerade mal 32bytes

Ich bin wie gesagt, sowieso eher ein Fan von SharedMem (was auch meine Pipe´s mit einschließt) und die Kommunikation welcher SharedMem wofür genutzt wird, das soll dann über Msgs laufen und alles andere halt über SharedMem (Pipe´s).
Ich denke ab 4kb kann man durchaus SharedMem nutzen, bzw sollte es auch. Sicher für einmalige Sachen ist das zwar scheiße, aber bevor ich das ganze in den Kernel kopiere und von dort aus dann wieder zum Clienten kopiere, finde ich SharedMem schneller (was ich aber nicht bzw. noch nicht beweisen kann) und angenehmer.

erik.vikinger · « **Antwort #16 am:** 31. August 2010, 20:34 »

Hallo,

Zitat von: FlashBurn am 30. August 2010, 13:03

Da ich mein Msg-System noch nicht wirklich nutzen muss, bin ich mir mit der Größe noch nicht sicher, aber im Moment sind es gerade mal 32bytes

Das ist, äh, ziemlich spartanisch. Damit kann man ja nichts weiter machen als Kommandos zu erteilen.

Zitat von: FlashBurn am 30. August 2010, 13:03

Sicher für einmalige Sachen ist das zwar scheiße, aber bevor ich das ganze in den Kernel kopiere und von dort aus dann wieder zum Clienten kopiere

Du versuchst immer das Kopieren beim Kernel zu vermeiden aber das Kopieren im User-Space scheint Dich nicht zu kümmern. So weit mir bekannt ist ist das Kopieren im User-Space nicht schneller also wo ist das Problem?

Zitat von: FlashBurn am 30. August 2010, 13:03

finde ich SharedMem schneller (was ich aber nicht bzw. noch nicht beweisen kann) und angenehmer.

Klar kann Shared-Memory ziemlich schnell sein aber nur wenn man den geschickt benutzt und das sehe ich bei Deinem Konzept noch nicht (sicher ändert sich das noch).

Falls wir uns auf ein Beispiel-Szenario einigen konnten wäre es nicht schlecht wenn Du Dein Konzept daran mal Schritt für Schritt ganz detailliert erklärst, sicher können wir das dann auch besser einschätzen. Ich persönlich habe wohl noch nicht alles da dran verstanden.

Grüße
Erik

FlashBurn · « **Antwort #17 am:** 31. August 2010, 20:52 »

Zitat von: erik

Das ist, äh, ziemlich spartanisch. Damit kann man ja nichts weiter machen als Kommandos zu erteilen.

Naja, die Planung sieht auch so aus, das es für viel mehr nicht genutzt werden soll, aber wie groß würdest du ihn denn machen? Aber bitte davon ausgehen, das ich fixed-size benutze und er nicht zu groß werden soll.

Zitat von: erik

Du versuchst immer das Kopieren beim Kernel zu vermeiden aber das Kopieren im User-Space scheint Dich nicht zu kümmern. So weit mir bekannt ist ist das Kopieren im User-Space nicht schneller also wo ist das Problem?

1. ist der KernelSpace begrenzt (was aber nicht wirklich ein Problem sein sollte) und 2. ist im schlimmsten Fall das Kopieren im UserSpace genauso langsam wie das Kopieren im KernelSpace.
Worauf ich hinaus möchte, im schlimmsten Fall bringt mir mein System gar nichts, aber im besten Fall hoffe ich (und viel mehr ist es leider im Moment auch nicht

) das es auf SMP System schneller ist als das Kopieren im KernelSpace (da es gleichzeitig stattfinden könnte).
Genauso versuche ich so viele Kernelaufrufe wie möglich zu vermeiden und da fällt mir dann doch ein dass das Kopieren im Kernel teurer ist als im UserSpace.
Denn im Kernel muss ich immer vorher gucken, ob der User überhaupt die Zugriffsrechte hat und ob der Speicher gemappt ist, aus dem kopiert werden soll. Wozu? Damit ich ja keine Exception im Kernel bekomme. Im UserSpace ist mir das egal, dann wird das Programm halt beendet.

Zitat von: erik

Falls wir uns auf ein Beispiel-Szenario einigen konnten wäre es nicht schlecht wenn Du Dein Konzept daran mal Schritt für Schritt ganz detailliert erklärst, sicher können wir das dann auch besser einschätzen. Ich persönlich habe wohl noch nicht alles da dran verstanden.

Bleiben wir doch bei der 300MB Datei. Das ich immer nur eine 4kb Page mappe, habe ich schon verworfen, da würden die ständigen Requests an den Service mir ne neue Page zu geben, die Performance auffressen.

Also ich sage dem VFS-Service (über ne Pipe) das ich eine Datei öffnen will und gebe noch den Pfad+Namen an. Hat das geklappt sage ich das ich halt die ganzen 300MB lesen will.
Der VFS-Service weist also den Treiber an die Datei zu laden (das VFS muss dazu im schlimmsten Fall sehr viele Anfragen machen, weil die Datei nicht zusammenhängend ist). Der Treiber macht das halt und erstellt nen SharedMem Bereich, setzt den VFS-Service auf die "allow"-Liste und gibt ihm die ID des SharedMem zurück. Dann "unmapped" er den SharedMem wieder und für ihn ist die Sache dann gegessen.
Der VFS-Service wiederrum setzt dann den Clienten auf die "allow"-Liste und gibt ihm die ID des SharedMem. Der Client kann den Speicher dann mappen (vorrausgesetzt er hat genug virtuellen Speicher frei) und dann werden die Daten in den Buffer des Clienten kopiert (ich kann und will dieses Kopieren nicht vermeiden).

Als ein potentielles Problem sehe ich, dass der Client den SharedMem nicht wieder freigibt. Denn so könnte es passieren, das der VFS-Service den Speicher gerne freigeben würde (ich meine wir reden hier von 300MB), aber das geht nicht (das weiß der Service aber nicht, für ihn funktioniert das ganze) da er ja noch beim Clienten gemappt ist.

Was ich gerade beim Schreiben schon optimiert habe, der VFS-Service muss die Datei noch nicht mal in seinen eigenen virtuellen Speicher mappen, es reicht ja vollkommen aus das er die ID des SharedMem speichert.

Falls du grobe Fehler siehst, dann immer raus damit!

erik.vikinger · « **Antwort #18 am:** 01. September 2010, 17:40 »

Hallo,

aber wie groß würdest du ihn denn machen? Aber bitte davon ausgehen, das ich fixed-size benutze und er nicht zu groß werden soll.

Sorry, da fragst Du den falschen. Ich persönlich bin der Meinung das es keine optimale Message-Größe gibt, es wird immer Dinge geben wo die Message nicht voll ausgelastet ist (so das Dein Kernel unnützes Zeug kopiert) genauso wie es immer Dinge geben wird wo die Message nicht ausreicht (so das irgendein komplexer Mechanismus her muss um das zu handeln). Aus meiner persönlichen Sicht sind nur flexible Message-Größen das einzig selig machende.

Worauf ich hinaus möchte, im schlimmsten Fall bringt mir mein System gar nichts, aber im besten Fall hoffe ich (und viel mehr ist es leider im Moment auch nicht ) das es auf SMP System schneller ist als das Kopieren im KernelSpace (da es gleichzeitig stattfinden könnte).

Aus meiner Sicht würde ich das anders formulieren: Im Average-Case ist Dein System X-fach langsamer als andere weil Du die Daten (mehrfach sogar, falls ich Dich richtig verstanden habe) kopierst und im Best-Case kommst Du immer noch nicht ganz an die Konkurrenz ran (selbst die nicht Zero-Copy-Konkurrenz dürfte kaum einholbar sein).

Genauso versuche ich so viele Kernelaufrufe wie möglich zu vermeiden

Aha, deswegen ein Haufen extra Syscalls für das Memory-Sharing usw?

und da fällt mir dann doch ein dass das Kopieren im Kernel teurer ist als im UserSpace.
Denn im Kernel muss ich immer vorher gucken, ob der User überhaupt die Zugriffsrechte hat und ob der Speicher gemappt ist, aus dem kopiert werden soll. Wozu? Damit ich ja keine Exception im Kernel bekomme. Im UserSpace ist mir das egal, dann wird das Programm halt beendet.

Okay, das ist ein gutes Argument nicht im Kernel zu kopieren. Auch mein Kernel soll den Speicher der Applikationen nur verwalten aber niemals hineinschauen, Exceptions im System-Mode wären auf meiner CPU tödlich.

Bleiben wir doch bei der 300MB Datei.

Gut.

Der VFS-Service weist also den Treiber an die Datei zu laden (das VFS muss dazu im schlimmsten Fall sehr viele Anfragen machen, weil die Datei nicht zusammenhängend ist).

Was ist bei Dir der "Treiber"? Der Dateisystem-Treiber (z.B. für ext2) oder der Block-Device-Treiber (z.B. für SATA)? Falls ersteres, warum sollte der VFS die Anfragen zerstückeln? Der weiß doch gar nicht das die Datei fragmentiert auf der Platte liegt (der VFS hat noch nicht mal ne Ahnung das man Dateien fragmentieren müsste/könnte). Falls letzteres, wo wird das Dateisystem verwaltet? Doch hoffentlich nicht im VFS, dann könnte man nicht mal einfach so ein NFS o.ä. einbinden.

Der Treiber macht das halt und erstellt nen SharedMem Bereich, setzt den VFS-Service auf die "allow"-Liste und gibt ihm die ID des SharedMem zurück.

Okay, ich denke das hab ich verstanden, aber das erscheint mir irgendwie unnötig umständlich.

Dann "unmapped" er den SharedMem wieder und für ihn ist die Sache dann gegessen.

Wer ist "er" und "ihn"? Falls beides der Block-Device-Treiber ist, warum wird der Speicher nicht erst mal vom Dateisystem-Treiber analysiert/ausgelesen?

Der VFS-Service wiederrum setzt dann den Clienten auf die "allow"-Liste und gibt ihm die ID des SharedMem. Der Client kann den Speicher dann mappen (vorrausgesetzt er hat genug virtuellen Speicher frei) und dann werden die Daten in den Buffer des Clienten kopiert

Ich denke das hab ich ebenfalls verstanden, auch wenn ich das immer noch ziemlich umständlich finde.

(ich kann und will dieses Kopieren nicht vermeiden).

Hier kommen wir meiner Meinung nach zum Problem in Deinem Konzept. Warum "willst" Du nicht auf das kopieren verzichten?

Als ein potentielles Problem sehe ich, dass der Client den SharedMem nicht wieder freigibt. Denn so könnte es passieren, das der VFS-Service den Speicher gerne freigeben würde (ich meine wir reden hier von 300MB), aber das geht nicht (das weiß der Service aber nicht, für ihn funktioniert das ganze) da er ja noch beim Clienten gemappt ist.

Es müsste eben ganz klar geregelt sein wann welcher Speicher wem gehört bzw. wer Zugriff drauf hat. In meinem Konzept ist das ganz klar geregelt, der Speicher gehört immer dem Client (außer wenn kopiert wurde natürlich) und der Service kann auf diesen Speicher genau so lange zugreifen wie der IPC-Vorgang dauert also der PopUp-Thread läuft (nur so lange sind die Segmente, die dem Service gegeben wurden, vorhanden). In dieser Zeit kann der Service diesen Speicher oder auch nur Teile davon seinerseits wieder an andere Services weiterreichen (ein Dateisystem-Treiber könnte z.B. einen Teil an den Block-Device-Treiber geben damit dieser dort ein Fragment einer Datei hinein lädt und einen anderen Teil mit einem weiteren IPC-Vorgang um ein weiteres Fragment der Datei zu laden).