Conocimiento

IA visión, transcripción y límites del plan

Cómo funcionan la descripción de imágenes y la transcripción de audio/vídeo en subidas y rastreos, qué cuenta en cuotas alojadas y cómo interactúan las claves Gemini de la organización (BYOK) con los límites.

reconocimiento imagentranscripcióngeminicuotabyokrastreo

FlexyAgents puede enriquecer el conocimiento con IA más allá del texto plano: Gemini visión describe imágenes para que la búsqueda semántica encuentre “capturas de la página de facturación”, y Gemini transcribe podcasts o vídeos de formación en texto buscable.

En infraestructura alojada, tu suscripción puede incluir topes mensuales separados para (1) reconocimiento de imagen en subidas frente a rastreos, y (2) transcripción de medios en subidas frente a rastreos. El OCR (texto desde píxeles) y los metadatos básicos no sustituyen a visión—son vías distintas y no son lo que miden esas cuotas de “reconocimiento de imagen”.

Añadir una clave API Google Gemini válida para tu organización (Ajustes → Claves API de LLM) enruta visión y transcripción por tu cuenta de Google, de modo que las cuotas alojadas de FlexyAgents para esas operaciones no se incrementan.

Los cuatro contadores alojados (cuando aplica)

Los administradores configuran límites en el plan. Los operadores ven el uso en la UI de conocimiento: las subidas muestran contadores del lado subida; la UI de rastreo muestra contadores del lado rastreo cuando activas procesamiento de medios.

Los límites usan ventanas de mes calendario y las mismas convenciones “ilimitado” que otros números del plan donde -1 significa sin tope.

  • Reconocimiento de imagen — subidas a la base: cuenta visión Gemini alojada exitosa en imágenes subidas.
  • Reconocimiento de imagen — rastreo web: cuenta visión Gemini alojada en imágenes descubiertas al rastrear.
  • Transcripción de medios — subidas: cuenta transcripción Gemini alojada en archivos de audio/vídeo subidos.
  • Transcripción de medios — rastreo: cuenta transcripción Gemini alojada en URLs de audio/vídeo obtenidas durante un rastreo.

Comportamiento y errores en subidas

Antes de procesar, la plataforma comprueba si la inferencia usará una clave Gemini alojada o la de tu organización. Si estás en inferencia alojada y ya se alcanzó el tope mensual, las nuevas subidas que requieran visión o transcripción pueden rechazarse con un error claro (mensajería tipo HTTP 402 en APIs) en lugar de guardar contenido vacío en silencio.

Si un plan BYOK exige tu propia clave Gemini y no hay ninguna configurada, se omiten pasos de visión y transcripción; aún puedes obtener texto OCR o metadatos de archivo donde aplique.

  • Añade una clave Gemini pronto si marketing o soporte suben muchas capturas o grabaciones.
  • Si las subidas fallan con mensaje de cuota, sube límites (admin), añade clave Gemini o sube temporalmente formatos orientados a texto.

Rastreo web: interruptores separados

La configuración de rastreo expone dos interruptores: reconocimiento de imagen (visión Gemini en imágenes descubiertas) y transcripción de audio/vídeo (Gemini en URLs de medios obtenidas). Puedes rastrear solo HTML, solo imágenes, solo medios o cualquier combinación.

Iniciar un rastreo que active cualquiera requiere una configuración Gemini resoluble: FlexyAgents alojado (según entorno) o tu clave Gemini de organización. Los rastreos solo texto no requieren Gemini.

  • Las peticiones heredadas de “procesar todo el medio” se mapean a ambos interruptores por compatibilidad.
  • Cuando se agotan las cuotas de rastreo alojado, imágenes o medios posteriores en ese rastreo pueden procesarse solo con OCR o marcadores de posición—diseñado para no cargar llamadas API fallidas contra los límites.

Qué deben vigilar los operadores

Combina analítica con mantenimiento del conocimiento: si los usuarios preguntan por visuales, asegura visión activa y cuotas suficientes. Si las transcripciones fallan, mejora calidad de audio o añade Q&A revisada por humanos para redacción crítica.

Documentación → Gobernanza → Claves API de LLM explica rotación y cumplimiento; Documentación → Conocimiento → Rastreo web cubre cortesía, semillas y ámbito.

Construye sobre tu pila tecnológica

¿Listo para desplegar asistentes fundamentados?

Empieza una prueba o cuéntanos tus necesidades de despliegue, gobernanza y requisitos empresariales.