Go使用Google Gemini Pro API创建简单聊天机器人

  目录

  gemini go sdk实现命令行聊天机器人

  最近Google 如期发布Gemini Pro API,目前为免费使用,Go的SDK也已经在github上发布了

  具体地址见:https://github.com/google/generative-ai-go

  本文将通过最新的gemini go sdk来实现命令行聊天机器人。

  Go语言实现监听键盘输入

  reader := bufio.NewReader(os.Stdin)

  // 读取输入直到遇到第一个换行符

  input, err := reader.ReadString('

  ')

  reader对象的ReadString方法即可实现我们需要的监听键盘的方法,这里设置为当监听到回车输入的时候,则读取用户输入的内容。

  整合Gemini SDK

  前提条件

  安装SDK

  go get github.com/google/generative-ai-go

  实例化一个gemini Client

  func getGeminiClient() *genai.Client {

  ctx := context.Background()

  client, err := genai.NewClient(ctx, option.WithAPIKey("YOUR-API-KEY"))

  if err != nil {

  log.Fatal(err)

  }

  return client

  }

  根据用户输入向gemini 服务器发请求。

  func handleChat(ctx context.Context, client *genai.Client, cs *genai.ChatSession, content string) error {

  if cs == nil {

  return errors.New("chat session is nil")

  }

  return geminiPro(ctx, cs, content)

  }

  func geminiPro(ctx context.Context, cs *genai.ChatSession, content string) error {

  prompt := genai.Text(content)

  iter := cs.SendMessageStream(ctx, prompt)

  fmt.Print("[Gemini]:")

  for {

  resp, err := iter.Next()

  if err == iterator.Done {

  break

  }

  if err != nil {

  fmt.Print("Something wrong, please try again later.

  ")

  return err

  }

  printChatResponse(resp)

  }

  return nil

  }

  func printChatResponse(resp *genai.GenerateContentResponse) {

  for _, c := range resp.Candidates {

  for _, p := range c.Content.Parts {

  fmt.Printf("%v", p)

  }

  }

  fmt.Println()

  }

  这里就是整个Gemini SDK调用的核心代码了,每次使用ChatSession对象(geminiPro方法中的cs变量)发送消息,这里使用的的是流式子消息传输,所以,在geminiPro方法里面,需要启动一个for循环,等待消息的全部输出。

  我们整个会话使用的都是同一个ChatSession对象,并且,在发送消息之后,内容会自动加到ChatSession对象的History里面,History也就是历史会话,Gemini SDK一样可以根据上下文来实现问答的实现。

  如何实现ChatSession只实例化一次

  前面已经说过,一个会话需要使用同一个ChatSession对象,我们自然而然就想到Go里面的sync.Once对象,但在使用Gemini Go SDK的过程中发现,经常会遇到请求出错的情况,一旦请求出错,就需要重新去创建一个会话对象,所以,Go语言提供的sync.Once并不能满足这个需求,所以,需要自己实现一个可以重置的Once对象,这里命名为ResetOnce对象,代码如下:

  // ResettableOnce 结构体包含一个互斥锁和一个标记是否已执行的布尔值

  type ResettableOnce struct {

  m sync.Mutex

  done bool

  }

  // Do 方法类似于 sync.Once 的 Do,但可以通过调用 Reset 来重置

  func (o *ResettableOnce) Do(f func()) {

  o.m.Lock()

  defer o.m.Unlock()

  if !o.done {

  defer func() { o.done = true }()

  f()

  }

  }

  // Reset 方法重置 Once,允许再次调用 Do

  func (o *ResettableOnce) Reset() {

  o.m.Lock()

  defer o.m.Unlock()

  o.done = false

  }

  如何实现用户ChatSession重新创建之后,保持之前的History?

  在实际的项目中,我们肯定会对History做持久化,但这里这里,仅使用一个全局的history来模拟持久化。

  当ChatSession对象被新建之后,需要将全局history的内容复制给新创建的ChatSession对象,这里为了模拟这个过程,在用户输入内容的时候,添加一个检测内容是否为reset字符串的操作,当检测用户输入为reset字符串的时候,则主动新建一个ChatSession,同时将新的ChatSession的History赋值为之前的history内容,这样即使新建立一个ChatSession它还能保持之前的会话记录。

  代码如下:

  func handleReset(client *genai.Client, cs **genai.ChatSession, history *[]*genai.Content) {

  fmt.Println("[System]", "Resetting chat session.")

  once.Reset()

  once.Do(func() {

  *cs = startChatSession(client, *history)

  })

  }

  func startChatSession(client *genai.Client, history []*genai.Content) *genai.ChatSession {

  model := client.GenerativeModel("gemini-pro")

  cs := model.StartChat()

  if len(history) > 0 {

  cs.History = history

  }

  return cs

  }

  总结

  如果在实际中使用这个SDK进行商业化开发,那么比如需要处理用户多会话的管理,其实这个过程也不麻烦,只要维护好用户以及它对应的history的关系,在用户每次开始登录进入系统,并且选择会话的时候,将对应的history给设好即可。但要注意的是,目前pro版本支持的最大的32K的上下文。另外SDK中还提供了模型的使用,你们有兴趣的可以自己去探索。

  以上就是Go使用Google Gemini Pro API创建简单聊天机器人的详细内容,更多关于go创建聊天机器人的资料请关注脚本之家其它相关文章!

  您可能感兴趣的文章: