Skip to content

Latest commit

 

History

History
255 lines (205 loc) · 17.9 KB

alpaca_prompt.md

File metadata and controls

255 lines (205 loc) · 17.9 KB

Multilingual Alpaca Prompt

Here the idea is to use the prompt from Alpaca to generate German training data as well.

Quality of the original Prompt

The self instructions of Alpaca have been generated by this prompt: prompt.txt

However, it contains several minor bugs that should be fixed for our purposes. These corrections were not applied to preserve the original conditions.

  • issues with numbering - see #24
  • a typo "instrucitons" vs. "instructions" - see comment

Improved Alpaca Prompt

The improved Alpaca prompt looks like this:

You are asked to come up with a set of 20 diverse task instructions. These task instructions will be given to a GPT model and we will evaluate the GPT model for completing the instructions.

Here are the requirements:
1. Try not to repeat the verb for each instruction to maximize diversity.
2. The language used for the instruction also should be diverse. For example, you should combine questions with imperative instructions.
3. The type of instructions should be diverse. The list should include diverse types of tasks like open-ended generation, classification, editing, etc.
4. A GPT language model should be able to complete the instruction. For example, do not ask the assistant to create any visual or audio output. For another example, do not ask the assistant to wake you up at 5pm or set a reminder because it cannot perform any action.
5. The instructions should be in English.
6. The instructions should be 1 to 2 sentences long. Either an imperative sentence or a question is permitted.
7. You should generate an appropriate input to the instruction. The input field should contain a specific example provided for the instruction. It should involve realistic data and should not contain simple placeholders. The input should provide substantial content to make the instruction challenging but should ideally not exceed 100 words.
8. Not all instructions require input. For example, when a instruction asks about some general information, "what is the highest peak in the world", it is not necssary to provide a specific context. In this case, we simply put "<noinput>" in the input field.
9. The output should be an appropriate response to the instruction and the input. Make sure the output is less than 100 words.

List of 20 tasks:

Translated German Prompt

This is a one to one translation using DeepL. However we have made 2 changes:

  • replaced "sollte" and "sollten" with "soll" and "sollen".
  • replace "Die Anweisungen sollen auf Englisch sein." with "Die Anweisungen sollen auf Deutsch sein.".
Sie werden gebeten, eine Reihe von 20 verschiedenen Aufgabenstellungen zu entwerfen. Diese Aufgabenstellungen werden einem GPT-Modell übergeben und wir werden das GPT-Modell für die Erfüllung der Aufgaben bewerten.

Hier sind die Anforderungen:
1. Versuchen Sie, das Verb nicht für jede Anweisung zu wiederholen, um die Vielfalt zu maximieren.
2. Die Sprache, die für die Instruktion verwendet wird, soll ebenfalls vielfältig sein. Kombinieren Sie zum Beispiel Fragen mit zwingenden Anweisungen.
3. Die Art der Anweisungen soll vielfältig sein. Die Liste soll verschiedene Aufgabentypen enthalten, wie z. B. die Erstellung offener Fragen, die Klassifizierung, die Bearbeitung usw.
4. Ein GPT-Sprachmodell soll in der Lage sein, die Anweisung auszuführen. Fordern Sie den Assistenten zum Beispiel nicht auf, eine visuelle oder akustische Ausgabe zu erstellen. Ein anderes Beispiel: Bitten Sie den Assistenten nicht, Sie um 17 Uhr zu wecken oder eine Erinnerung zu setzen, da er keine Aktion ausführen kann.
5. Die Anweisungen sollen auf Deutsch sein.
6. Die Anweisungen sollen 1 bis 2 Sätze lang sein. Es ist entweder ein Imperativsatz oder eine Frage erlaubt.
7. Sie sollen eine geeignete Eingabe für die Anweisung erstellen. Das Eingabefeld soll ein konkretes Beispiel enthalten, das für die Anweisung vorgesehen ist. Es soll realistische Daten enthalten und keine einfachen Platzhalter. Die Eingabe soll einen substanziellen Inhalt haben, um die Anweisung anspruchsvoll zu machen, aber idealerweise nicht mehr als 100 Wörter umfassen.
8. Nicht alle Anweisungen erfordern eine Eingabe. Wenn z. B. eine Anweisung nach einer allgemeinen Information fragt, z. B. "Was ist der höchste Berg der Welt? In diesem Fall geben wir einfach "<keine Eingabe>" in das Eingabefeld ein.
9. Die Ausgabe soll eine angemessene Antwort auf die Anweisung und die Eingabe sein. Achten Sie darauf, dass die Ausgabe weniger als 100 Wörter umfasst.

Liste von 20 Aufgaben:

Example German Output

Example output generated by GPT-3.5 (March 25, 2023) with ChatGPT Plus web-ui:

Schreiben Sie eine Zusammenfassung des Textes "Die Geschichte der deutschen Sprache" aus dem Buch "Deutsche Sprachgeschichte" von Peter von Polenz.
Eingabe: Kapitel 3 des Buches "Deutsche Sprachgeschichte" von Peter von Polenz.
Ausgabe: Eine Zusammenfassung des Kapitels 3 des Buches "Deutsche Sprachgeschichte" von Peter von Polenz, in dem die Geschichte der deutschen Sprache von ihren Ursprüngen bis zur Gegenwart behandelt wird.

Klassifizieren Sie die folgenden Sätze als einfach oder zusammengesetzt: "Ich ging zur Schule und traf meine Freunde." und "Nachdem ich meine Hausaufgaben gemacht hatte, spielte ich Videospiele."
Eingabe: Die beiden Sätze.
Ausgabe: Der erste Satz ist einfach und der zweite Satz ist zusammengesetzt.

Erstellen Sie fünf offene Fragen zu dem Thema "Klimawandel".
Eingabe: <keine Eingabe>
Ausgabe: 1. Was ist der Klimawandel und welche Auswirkungen hat er auf die Umwelt? 2. Was sind die Ursachen des Klimawandels und wie können sie bekämpft werden? 3. Welche Rolle spielen Regierungen und Unternehmen bei der Bekämpfung des Klimawandels? 4. Wie kann jeder Einzelne seinen Teil dazu beitragen, den Klimawandel zu stoppen? 5. Welche Technologien und Innovationen können dazu beitragen, den Klimawandel zu bekämpfen?

Übersetzen Sie den folgenden Satz ins Englische: "Ich liebe es, in meinem Garten zu arbeiten."
Eingabe: "Ich liebe es, in meinem Garten zu arbeiten."
Ausgabe: "I love working in my garden."

Beschreiben Sie das Konzept des "Unbewussten" in der Psychoanalyse von Sigmund Freud.
Eingabe: <keine Eingabe>
Ausgabe: Eine Beschreibung des Konzepts des "Unbewussten" in der Psychoanalyse von Sigmund Freud, einschließlich seiner Entstehung, Funktion und Auswirkungen auf das menschliche Verhalten.

Erklären Sie den Unterschied zwischen einer Hypothese und einer Theorie in der Wissenschaft.
Eingabe: <keine Eingabe>
Ausgabe: Eine Erklärung des Unterschieds zwischen einer Hypothese und einer Theorie in der Wissenschaft, einschließlich ihrer Bedeutung, Verwendung und Validierung.

Finden Sie Synonyme für die folgenden Wörter: "groß", "klein", "schnell", "langsam".
Eingabe: "groß", "klein", "schnell", "langsam".
Ausgabe: Synonyme für "groß" sind zum Beispiel "riesig", "gewaltig" und "mächtig". Synonyme für "klein" sind zum Beispiel "winzig", "kümmern" und "gering". Synonyme für "schnell" sind zum Beispiel "rasch", "flott" und "fix". Synonyme für "langsam" sind zum Beispiel "gemächlich", "träge" und "schleppend".

[...]

Example output generated by GPT-4 (March 25, 2023) with ChatGPT Plus web-ui:

Aufgabenstellung: Beschreiben Sie die Handlung des folgenden Films in wenigen Sätzen.
Eingabe: "Forrest Gump"
Ausgabe: "Forrest Gump ist ein warmherziger Film über das Leben eines einfältigen Mannes namens Forrest, der trotz seiner geistigen Behinderung und seines langsamen Denkvermögens eine Reihe außergewöhnlicher Erfahrungen macht und beeindruckende Errungenschaften erzielt. Seine Lebensgeschichte beinhaltet die Teilnahme am Vietnamkrieg, das Treffen mit US-Präsidenten und das Erreichen von Ruhm als Tischtennisspieler."

Aufgabenstellung: Wie würden Sie das folgende Zitat interpretieren?
Eingabe: "Die einzige Konstante im Universum ist die Veränderung."
Ausgabe: "Dieses Zitat bedeutet, dass im Universum ständig Veränderungen stattfinden und nichts für immer gleich bleibt. Alles ist in einem ständigen Wandel begriffen, und man muss sich anpassen und mit diesen Veränderungen umgehen können."

Aufgabenstellung: Erklären Sie das Konzept der Schwerkraft.
Eingabe: "<keine Eingabe>"
Ausgabe: "Die Schwerkraft ist eine fundamentale Kraft im Universum, die Objekte mit Masse anzieht. Sie sorgt dafür, dass Objekte auf der Erde zu Boden fallen und hält Planeten in ihren Umlaufbahnen um die Sonne. Die Gravitationskraft zwischen zwei Objekten hängt von ihrer Masse und dem Abstand zwischen ihnen ab."

Aufgabenstellung: Paraphrasieren Sie den folgenden Text.
Eingabe: "Die Digitalisierung hat die Art und Weise, wie wir arbeiten und leben, grundlegend verändert."
Ausgabe: "Durch die Digitalisierung wurden unser Arbeits- und Lebensstil tiefgreifend umgewandelt."

Aufgabenstellung: Welche Hauptzutaten werden für ein klassisches Pesto benötigt?
Eingabe: "<keine Eingabe>"
Ausgabe: "Ein klassisches Pesto besteht aus Basilikum, Knoblauch, Pinienkernen, Parmesan oder Pecorino, Olivenöl und Salz."

Aufgabenstellung: Nennen Sie drei Vorteile von Solarenergie.
Eingabe: "<keine Eingabe>"
Ausgabe: "Solarenergie ist umweltfreundlich, erneuerbar und kosteneffizient."

Aufgabenstellung: Ordnen Sie die folgenden Ereignisse in chronologischer Reihenfolge.
Eingabe: "Mauerfall, Erster Weltkrieg, Gründung der Europäischen Union"
Ausgabe: "Erster Weltkrieg, Mauerfall, Gründung der Europäischen Union"

Aufgabenstellung: Welche berühmte Persönlichkeit sagte: "Sei du selbst, alle anderen sind bereits vergeben"?
Eingabe: "<keine Eingabe>"
Ausgabe: "Oscar Wilde"

[...]

Further Problems and Improvements

Recent Events

ChatGPT sometimes generates output like this:

Stellen Sie dem Assistenten eine Ja/Nein-Frage zu einem aktuellen Ereignis und geben Sie eine konkrete Eingabe für die Frage an.
Eingabe: Hat der FC Bayern München das letzte Champions League-Spiel gewonnen?
Antwort: Nein, der FC Bayern München hat das letzte Champions League-Spiel verloren.

Asking questions about recent sports events does not seem to be helpful. A possible solution can be to tell ChatGPT: "Do not ask questions about recent events."

Further Topics

  • The whole German text can be made much more compact and shorter.

Improved Translated German Prompt

This is an improved version of the translated German Alpaca prompt.

Entwerfe eine Reihe von 10 verschiedenen Aufgabenstellungen. Diese Aufgabenstellungen werden einem GPT-Modell übergeben. Wir werden das GPT-Modell bei der Erfüllung der Aufgabenstellungen bewerten. Jede einzelne Aufgabenstellung besteht aus genau einer Anweisung, eventuell einer Eingabe und immer einer Antwort.

Hier sind die Anforderungen:
1. Das Verb in den Anweisungen darf sich nicht wiederholen.
2. Die Sprache für die Anweisungen muss vielfältig sein. Kombiniere zum Beispiel Fragen mit zwingenden Instruktionen.
3. Die Art der Anweisungen muss vielfältig sein. Die Anweisungen müssen verschiedene Aufgabentypen enthalten, wie z. B. die Erstellung offener Fragen, die Klassifizierung, die Bearbeitung usw.
4. Ein GPT-Sprachmodell muss in der Lage sein, die Anweisung auszuführen. Fordere den Assistenten zum Beispiel nicht auf, eine visuelle oder akustische Ausgabe zu erstellen. Bitte zum Beispiel den Assistenten nicht, Dich um 17 Uhr zu wecken oder eine Erinnerung zu setzen, da er keine Aktion ausführen kann.
5. Die Aufgabenstellung muss auf Deutsch sein.
6. Die Anweisungen müssen 1 bis 2 Sätze lang sein. Es ist entweder ein Imperativsatz oder eine Frage erlaubt.
7. Erstelle eine geeignete Eingabe für jede Anweisung. Das Feld namens Eingabe soll ein konkretes Beispiel für die Anweisung enthalten. Die Eingabe soll realistische Daten enthalten und keine einfachen Platzhalter. Die Eingabe soll einen substanziellen Inhalt haben, um die Aufgabenstellung anspruchsvoll zu machen.
8. Nicht alle Anweisungen erfordern eine Eingabe. Wenn z. B. eine Anweisung nach einer allgemeinen Information fragt, z. B. "Was ist der höchste Berg der Welt? In diesem Fall gebe einfach "<keine Eingabe>" in das Feld Eingabe ein.
9. Das Feld Ausgabe muss eine angemessene Antwort auf die Anweisung und die Eingabe sein. Achte darauf, dass die Ausgabe weniger als 100 Wörter lang ist.

Liste von 10 Aufgabenstellungen:

Problems of Improved Translated German Prompt

"Anweisung" and "Eingabe" contain very much overlapping content. This makes the "Anweisung" superfluous. Examples:

Example 1:

Erstelle eine offene Frage zu einem Thema deiner Wahl.
Eingabe: Erstelle eine offene Frage zur aktuellen Situation in der Politik.
Ausgabe: Was sind die größten Herausforderungen, denen die politischen Führer heute gegenüberstehen und wie können sie diese bewältigen?

Example 2:

Klassifiziere die folgenden Objekte in zwei Kategorien.
Eingabe: Klassifiziere die folgenden Objekte in zwei Kategorien: Apfel, Birne, Tisch, Stuhl.
Ausgabe: Obst, Möbel.

An other problem is questions about personal events. The problem with this is that the model can have no knowledge of it and is made to hallucinate.

Schreibe einen Text über ein Ereignis deiner Wahl.
Eingabe: Schreibe einen Text über das letzte Konzert, auf dem du warst.
Ausgabe: Das letzte Konzert, das ich besucht habe, war ein unvergessliches Erlebnis. Die Energie der Musik und die Begeisterung der Fans machten den Abend zu etwas ganz Besonderem.

Improved and simplified Translated German Prompt

Entwerfe eine Reihe von 5 verschiedenen Aufgabenstellungen. Diese Aufgabenstellungen werden einem GPT-Modell übergeben. Das GPT-Modell wird dann bei der Erfüllung dieser Aufgabenstellungen bewertet. Jede einzelne Aufgabenstellung besteht aus genau einer Anweisung und immer einer Antwort der Anweisung.

Hier sind die Anforderungen:
1. Die Aufgabenstellung muss auf Deutsch sein.
2. Im Feld namens "Anweisung" muss die Sprache vielfältig sein. Kombiniere zum Beispiel Fragen mit zwingenden Instruktionen.
3. Das Verb in den Anweisungen darf sich nicht wiederholen.
4. Die Art der Anweisungen muss vielfältig sein. Die Anweisungen müssen verschiedene Aufgabentypen enthalten, wie z. B. die Erstellung offener Fragen, die Klassifizierung, die Bearbeitung usw.
5. Ein GPT-Sprachmodell muss in der Lage sein, die Anweisung auszuführen. Fordere den Assistenten zum Beispiel nicht auf, eine visuelle oder akustische Ausgabe zu erstellen. Bitte zum Beispiel den Assistenten nicht, Dich um 17 Uhr zu wecken oder eine Erinnerung zu setzen, da er keine Aktion ausführen kann.
6. Die Anweisung muss entweder ein Imperativsatz oder eine Frage sein.
7. Die Anweisung muss realistische Daten enthalten.
8. Die Anweisung muss anspruchsvoll sein.
9. Das Feld "Antwort" muss eine angemessene und präzise Antwort auf die Anweisung sein.
10. Benutze in der Antwort den Indikativ und keinen Konjunktiv.

Liste von 5 Aufgabenstellungen:

Observations that should be removed later

  • Ereignisse
  • Situationen
  • Geschichten
  • Kurzgeschichten
  • Trends
  • Artikel
  • Links
  • Zeitungsartikel
  • Blogs

An other Alpaca Prompt

Entwerfe eine Reihe von 10 verschiedenen Aufgabenstellungen. Diese Aufgabenstellungen werden einem GPT-Modell übergeben. Wir werden das GPT-Modell bei der Erfüllung der Aufgabenstellungen bewerten. Jede einzelne Aufgabenstellung besteht aus genau einer Anweisung, eventuell einer Eingabe und immer einer Antwort.

Hier sind die Anforderungen:
Das Verb in den Anweisungen darf sich nicht wiederholen.
Die Sprache für die Anweisungen muss vielfältig sein. Kombiniere zum Beispiel Fragen mit zwingenden Instruktionen.
Die Art der Anweisungen muss vielfältig sein. Die Anweisungen müssen verschiedene Aufgabentypen enthalten, wie z. B. die Erstellung offener Fragen, die Klassifizierung, die Bearbeitung usw.
Ein GPT-Sprachmodell muss in der Lage sein, die Anweisung auszuführen. Fordere den Assistenten zum Beispiel nicht auf, eine visuelle oder akustische Ausgabe zu erstellen. Bitte zum Beispiel den Assistenten nicht, Dich um 17 Uhr zu wecken oder eine Erinnerung zu setzen, da er keine Aktion ausführen kann.
Die Aufgabenstellung muss auf Deutsch sein.
Die Anweisungen müssen 1 bis 2 Sätze lang sein. Es ist entweder ein Imperativsatz oder eine Frage erlaubt.
Erstelle eine geeignete Eingabe für jede Anweisung. Das Feld namens Eingabe soll ein konkretes Beispiel für die Anweisung enthalten. Die Eingabe soll realistische Daten enthalten und keine einfachen Platzhalter. Die Eingabe soll einen substanziellen Inhalt haben, um die Aufgabenstellung anspruchsvoll zu machen.
Nicht alle Anweisungen erfordern eine Eingabe. Wenn z. B. eine Anweisung nach einer allgemeinen Information fragt, z. B. "Was ist der höchste Berg der Welt? In diesem Fall gebe einfach "<keine Eingabe>" in das Feld Eingabe ein.
Das Feld Ausgabe muss eine angemessene Antwort auf die Anweisung und die Eingabe sein. Achte darauf, dass die Ausgabe weniger als 100 Wörter lang ist.

Die Liste der 10 Aufgabenstellungen:

Alpaca prompt without "input"

Du bist ein Lehrer. Entwerfe 10 verschiedene Aufgaben um Deine Schüler zu testen. Jede einzelne Aufgabe besteht aus einer Anweisung und einer Antwort.

Die Anforderungen an die Aufgaben sind:
Das Verb in den Anweisung darf sich nicht wiederholen.
Die Sprache für die Anweisung muss vielfältig sein. Kombiniere zum Beispiel Fragen mit Instruktionen.
Die Art der Anweisung muss vielfältig sein. Die Anweisungen müssen verschiedene Aufgabentypen enthalten, wie z. B. die Erstellung offener Fragen, die Klassifizierung, die Bearbeitung und so weiter.
Alle Texte müssen auf Deutsch sein.
Die Anweisung ist entweder ein Imperativsatz oder eine Frage.
Die Anweisung muss einen substanziellen Inhalt haben, um die Aufgabenstellung anspruchsvoll zu machen.
Das Feld Ausgabe muss eine angemessene Antwort auf die Anweisung sein.
Die Ausgabe muss weniger als 100 Wörter lang sein.

Deine Liste der 10 Aufgabenstellungen ist: