Attention De Requ??te Group??e

L’Attention de requ??te group??e (GQA) est une technique utilis??e dans les grands mod??les de langage pour acc??l??rer le temps d’inf??rence. Elle regroupe les requ??tes ensemble et calcule leur attention conjointement, r??duisant la complexit?? computationnelle et rendant le mod??le plus efficace.

Attention De Requ??te Group??e

Areas of application

  • Traitement du langage naturel
  • Intelligence artificielle
  • Robotique
  • Traduction automatique
  • Syst??mes de recommandation
  • Pr??vision de s??ries chronologiques
  • Syst??mes de reconnaissance vocale
  • Big data

Example

Par exemple, si un mod??le de langage doit traiter une s??rie de requ??tes de type ‘What is the capital of France?’, GQA peut groupiser ces requ??tes ensemble et les traiter en une seule et m??me fois, r??duisant le temps d’inference n??cessaire.