Artículo

Prompt engineering en español argentino: qué cambia

Los modelos lingüísticos manejan español, pero no todos los españoles. Diferencias prácticas entre español argentino, español neutro e inglés en prompt engineering. Voseo en prompts, con ejemplos antes y después.

Cualquiera que haya probado un modelo de lenguaje grande (LLM) sabe que entiende español. Lo que poca gente nota al principio es que no entiende todos los españoles del mismo modo. Para una empresa argentina que quiere usar IA en atención al cliente, en redacción comercial, en automatización interna, la diferencia entre escribir el prompt en inglés, en español neutro o en español argentino con voseo no es estética: cambia el resultado, los costos en tokens y, sobre todo, la voz del producto final.

Esta nota es un repaso práctico de qué cambia cuando trabajás prompt engineering específicamente en español argentino, con ejemplos antes y después, y con criterios para decidir cuándo conviene cada variante.

Por qué la variante de español importa en prompts

Los modelos grandes (GPT-4 y sucesores, Claude 3.5 y posteriores, Gemini 1.5 y siguientes) están entrenados principalmente en inglés. El español es el segundo o tercer idioma en volumen de datos, dependiendo del modelo. Dentro del español, la mayor parte del corpus es español peninsular, español neutro de medios internacionales, y mexicano. El argentino, el chileno y el uruguayo aparecen en mucha menor proporción.

Eso tiene tres consecuencias prácticas. Primera: cuando le pedís a un modelo que escriba en español sin más especificación, te devuelve un español neutro con tendencia ibérica. Segunda: cuando le pedís específicamente argentino, el resultado varía mucho entre modelos. Tercera: el voseo es la forma más fácilmente reconocible de argentinidad, y los modelos lo manejan con calidad desigual, dependiendo de cuán explícitamente lo pidas y de cómo des ejemplos.

Cómo GPT, Claude y Gemini interpretan el voseo

Los tres modelos principales manejan voseo, pero con diferencias notables. GPT (versiones 4 y posteriores) tiende a producir voseo correcto cuando se lo pedís, con buena conjugación verbal en presente (vos sabés, vos tenés, vos podés). Donde flaquea es en imperativos: a veces produce formas incorrectas tipo “tené” en lugar de “tené” (la forma argentina sin tilde marcada en el imperativo de segunda persona). Es una falla menor pero detectable por hablante nativo.

Claude (versiones 3.5 y posteriores) maneja voseo con muy buena calidad gramatical, y respeta consistencia a lo largo de respuestas largas. Su tendencia natural sin instrucción es el español neutro con leve toque ibérico. Una vez que le pedís voseo argentino explícitamente, lo sostiene bien.

Gemini varía más entre versiones. Las versiones 1.5 y 2 manejan voseo con calidad aceptable pero con tendencia a deslizamientos hacia tuteo en respuestas largas. Si lo usás en chatbot de atención al cliente, conviene una capa de validación que detecte “tú”, “tienes”, “puedes” en outputs y los reemplace.

Para evitar esas faltas, conviene reforzar el voseo en system prompt y validar outputs largos.

Prompt en inglés vs español: qué se pierde y qué se gana

Hay una práctica común entre desarrolladores que aprendieron prompt engineering con material en inglés: escribir las instrucciones del system prompt en inglés y pedir el output en español. La lógica es que el modelo está mejor entrenado en inglés y va a entender mejor las instrucciones. La práctica tiene sentido en algunos casos y deja de tenerlo en otros.

A favor del prompt en inglés. La instrucción del sistema es más densa y precisa: “Be concise” pesa menos en tokens que “Sé conciso, no agregues frases de relleno”. Para flujos automatizados donde el costo en tokens importa (millones de llamadas), el ahorro es real. Y para tareas de razonamiento puro (análisis, clasificación, extracción), el inglés da resultados levemente más consistentes en algunos benchmarks.

A favor del prompt en español argentino. Cuando la tarea es generar contenido de voz argentina, el modelo activa mejor su registro de voseo si todo el contexto está en argentino, no solo la instrucción de output. Si el system prompt dice “you must use voseo” pero todo el resto del contexto es inglés, el modelo a veces produce voseo gramaticalmente correcto pero con sintaxis traducida. Si todo el prompt está en argentino, la naturalidad sube.

Mi regla práctica: para automatizaciones internas donde el tono no importa, podés usar inglés en el system prompt. Para cualquier output que va a ver un cliente argentino, el prompt entero en argentino, sin compromisos.

Voseo, tuteo y formal: cuándo cada uno

No todo prompt argentino requiere voseo. Hay tres registros y vale la pena diferenciarlos.

Voseo argentino estándar. “Vos podés escribirnos a esta dirección”. Es el registro natural en conversación argentina entre desconocidos respetuosos pero no jerárquicos. Funciona en atención al cliente B2C, en marketing de marca con voz cercana, en chatbots de servicios cotidianos. Es lo que esperás cuando hablás con un humano argentino que no te conoce pero tampoco te está atendiendo de tipo “señor”.

Tuteo en contexto argentino. “Tú puedes escribirnos”. Funciona muy raramente en Argentina, y solo en contextos donde el cliente espera neutralidad pan-latina, o donde la marca decide explícitamente sonar internacional. Aerolíneas pan-latinas, plataformas globales con localización débil. En empresas argentinas auténticas, suena fuera de lugar.

Formal con usted. “Usted puede escribirnos”. Útil en contextos jurídicos, contables, financieros institucionales, o en comunicaciones formales donde la jerarquía importa. Algunos bancos argentinos lo siguen usando. Estudios jurídicos también. No es viejo: es preciso para registros donde la cercanía sería inapropiada.

La decisión de cuál usar la tomás vos, no el modelo. Lo que el modelo necesita es claridad. Si en el prompt decís “español argentino, voseo, registro cercano pero respetuoso, no usar ‘tú’ ni ‘usted’ nunca”, el modelo va a sostenerlo. Si decís solo “argentino”, el resultado va a oscilar.

Ejemplos antes y después: cinco prompts reescritos

Vale más un ejemplo que diez recomendaciones. Mostremos cinco casos con la versión mal hecha y la versión mejorada.

Ejemplo uno: respuesta a consulta comercial.

Mal: “Eres un asistente. Responde a la consulta del cliente.”

Mejor: “Sos asistente comercial de una PyME argentina que vende equipamiento industrial. Respondé a la consulta del cliente en español argentino con voseo. Tono respetuoso pero cercano, frases cortas (15-25 palabras), evitá decir ‘estoy a tu disposición’ o frases hechas. Si la consulta pide un dato que no tenés, decilo directo y proponé escribir a ventas@empresa.com.”

El segundo prompt es más largo, pero el output va a tener voz reconocible, no plantilla.

Ejemplo dos: resumen de reunión.

Mal: “Resume la reunión en bullet points.”

Mejor: “Resumí la reunión interna que se transcribe abajo. Devolveme: tres a cinco decisiones tomadas con responsable asignado cuando esté nombrado, lista de próximos pasos con fecha si fue mencionada, dos o tres temas abiertos que quedaron sin resolver. No inventes asignación de responsables si no se mencionó. Voseo en argentino. Sin frases de relleno como ‘En síntesis’ o ‘En conclusión’.”

El segundo prevé el modo en que el modelo suele cometer errores (inventar responsables, agregar filler) y lo bloquea por adelantado.

Ejemplo tres: clasificación de tickets.

Mal: “Clasifica este ticket de atención al cliente.”

Mejor: “Clasificá este ticket de atención al cliente en una de las siguientes seis categorías exactas: facturación, envío, devolución, producto defectuoso, consulta técnica, otro. Devolveme solo la categoría, sin explicación. Si dudás entre dos, elegí la primera del orden listado.”

Acá la mejora no es de tono sino de estructura: forzar output predecible, dar regla de desempate.

Ejemplo cuatro: redacción de propuesta comercial.

Mal: “Escribe una propuesta para este cliente.”

Mejor: “Escribí la primera versión de propuesta comercial para una PyME argentina del sector retail. Estructura: contexto del cliente en dos frases, alcance del trabajo en tres a cinco puntos, plazo estimado, condiciones generales. Voseo en argentino, tono profesional pero no acartonado. No incluyas precios. No uses frases como ‘transformación digital’, ‘soluciones a medida’, ‘potenciamos tu negocio’: preferí decir lo que hacemos concretamente.”

El bloqueo explícito de marketing-speak es la pieza clave. Sin ese bloqueo, los modelos los introducen por defecto.

Ejemplo cinco: análisis de comentarios de cliente.

Mal: “Analiza estos comentarios.”

Mejor: “Analizá la lista de comentarios de clientes argentinos sobre nuestro producto. Devolveme: tres temas recurrentes positivos con cantidad aproximada de menciones, tres temas recurrentes negativos con cantidad, un comentario textual ejemplificador por cada tema (citá entre comillas), una recomendación de acción para los dos temas negativos más urgentes. Voseo en argentino. No suavices comentarios negativos.”

Acá la pieza importante es “no suavices comentarios negativos”: los modelos tienden a moderar tono crítico cuando resumen.

Localización para clientes argentinos en chatbots

Si vas a poner un chatbot en producción para usuarios argentinos, hay tres cuidados específicos más allá del voseo.

Manejo de horarios y fechas. Argentina usa formato día/mes/año, no mes/día/año. Y los horarios suelen ser 24h en contextos profesionales. El modelo tiene que conocer el huso horario argentino (UTC-3) y responder consistentemente. Si decís “el martes a las 15:00”, asegurate de que el modelo no traduzca a un formato anglo.

Referencias culturales. Decir “el lunes después del feriado del 24 de marzo” requiere que el modelo conozca el calendario argentino. Si tu base de conocimiento es genérica, el modelo no va a sabe qué es el Día Nacional de la Memoria. Conviene incluir el calendario de feriados argentinos en el contexto del sistema cuando aplica.

Tratamientos. “Doctor”, “ingeniero”, “contador” funcionan en Argentina como tratamiento profesional cuando el cliente los da por su parte. El bot no debería asumir títulos no declarados, pero debería respetarlos si el cliente firma como “Cont. Pérez” o “Dr. Gómez”.

Si querés profundizar en cómo aplicar todo esto en un producto concreto, prompt engineering aplicado trabaja sobre los prompts del producto real. Si estás armando un agente con voz local, agentes con voz local cubre la arquitectura completa con el tono incluido. Y si querés ver diez prompts probados y listos para adaptar, 10 prompts probados para PyME argentinas tiene la librería completa.

Lo que sigue conviniendo escribir en inglés

Para cerrar honestamente, hay tres casos donde te conviene seguir trabajando en inglés.

Documentación técnica interna del sistema. Si tu equipo es bilingüe y prefiere documentar arquitectura en inglés, no fuerces español. La documentación técnica es para el equipo, no para el cliente.

Prompts para tareas de razonamiento puro con output estructurado. Si el output va a una API o a un parser, el idioma del prompt no afecta la calidad del JSON. Inglés ahorra tokens, es preciso, no pierde nada porque el cliente nunca lo va a ver.

Consultas a documentación oficial. Si le preguntás al modelo sobre el Reglamento UE 2024/1689, conviene preguntar en inglés porque la documentación oficial principal está en inglés en el corpus. La precisión técnica sube. Si el output después tiene que ir al cliente argentino, le pedís una pasada de traducción al voseo en un segundo prompt.

Para todo lo demás, español argentino con voseo, voz consistente, sin compromisos. Es la diferencia entre un producto que suena a sí mismo y un producto que suena a traducción torpe. La diferencia se nota. Los clientes la notan. Y, en mercado argentino, esa diferencia es lo que separa una herramienta que se adopta de una que se cancela al tercer mes.

Para más información sobre cómo escribir prompts efectivos en general, la guía de prompt engineering de Anthropic y el cookbook oficial de OpenAI son dos referencias canónicas en inglés. Si querés conversar sobre tu caso, escribime a r@patron.ar con un ejemplo del prompt que estás usando y el output que te devuelve. Una conversación de treinta minutos suele alcanzar para ver qué ajustar.