Bob está en la sala de estar.
Camina hacia la cocina, llevando una taza.
Él pone una pelota en la taza y lleva la taza al dormitorio.
Voltea la taza boca abajo y luego camina hacia el jardín.
Pone la taza en el jardín y luego camina hacia el garaje.
¿Dónde está la pelota?
ChatGPT 3.5 |
ChatGPT 4 |
Claude |
Gemini |
Perplexity |
Neuroflash |
Huggingface (Mistral) |
Copilot |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
Cocina |
Jardín |
Dormitorio |
Jardín |
En la taza no está |
Dormitorio++ |
Dormitorio |
Taza@Jardin |
Esto se podría mejorar con la cadena del pensamiento, pidiéndole al LLM que vaya explicando su respuesta, pero se ha encontrado que la efectividad varia (2DO: hacer los ejemplos)
Imagina que tres expertos diferentes están respondiendo a esta pregunta.
Todos los expertos escribirán un paso de su pensamiento, luego lo compartirán con el grupo.
Luego, todos los expertos pasarán al siguiente paso, etc.
Si algún experto se da cuenta de que está equivocado en algún momento, entonces se retirará.
La pregunta es...
ChatGPT 3.5 |
ChatGPT 4 |
Claude |
Gemini |
Perplexity |
Neuroflash |
Huggingface (Mistral) |
Copilot |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
Cocina |
Jardín |
Dormitorio |
Jardín |
En la taza no está |
Dormitorio++ |
Dormitorio |
Taza@Jardin |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
📋 |
Dormitorio |
Dormitorio |
Jardín |
Faltan datos |
"Meme" |
Dormitorio |
En la taza |
3 posibles sitios |