Release 0.6.2 (#1217 )

Co-authored-by: github-actions[bot] <github-actions[bot]@users.noreply.github.com> Co-authored-by: himself65 <himself65@users.noreply.github.com>
refactor: chat memory & chat history into core module (#1201 )
2026-07-01 22:14:03 -04:00 · 2024-09-16 16:40:33 -07:00 · 2024-09-16 16:09:17 -07:00 · 2024-09-16 16:05:47 -07:00 · 2024-09-16 15:51:24 -07:00
66 changed files with 610 additions and 473 deletions
@@ -1,5 +1,12 @@
 # docs

+## 0.0.71
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.0.70

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "docs",
-  "version": "0.0.70",
+  "version": "0.0.71",
  "private": true,
  "scripts": {
    "docusaurus": "docusaurus",
@@ -1,4 +1,4 @@
-import { Anthropic, SimpleChatEngine, SimpleChatHistory } from "llamaindex";
+import { Anthropic, ChatMemoryBuffer, SimpleChatEngine } from "llamaindex";
 import { stdin as input, stdout as output } from "node:process";
 import readline from "node:readline/promises";

@@ -8,8 +8,8 @@ import readline from "node:readline/promises";
    model: "claude-3-opus",
  });
  // chatHistory will store all the messages in the conversation
-  const chatHistory = new SimpleChatHistory({
-    messages: [
+  const chatHistory = new ChatMemoryBuffer({
+    chatHistory: [
      {
        content: "You want to talk in rhymes.",
        role: "system",
@@ -2,10 +2,10 @@ import { stdin as input, stdout as output } from "node:process";
 import readline from "node:readline/promises";

 import {
+  ChatSummaryMemoryBuffer,
  OpenAI,
  Settings,
  SimpleChatEngine,
-  SummaryChatHistory,
 } from "llamaindex";

 if (process.env.NODE_ENV === "development") {
@@ -18,7 +18,7 @@ async function main() {
  // Set maxTokens to 75% of the context window size of 4096
  // This will trigger the summarizer once the chat history reaches 25% of the context window size (1024 tokens)
  const llm = new OpenAI({ model: "gpt-3.5-turbo", maxTokens: 4096 * 0.75 });
-  const chatHistory = new SummaryChatHistory({ llm });
+  const chatHistory = new ChatSummaryMemoryBuffer({ llm });
  const chatEngine = new SimpleChatEngine({ llm });
  const rl = readline.createInterface({ input, output });

@@ -1,5 +1,12 @@
 # @llamaindex/autotool

+## 3.0.2
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 3.0.1

 ### Patch Changes
@@ -1,5 +1,13 @@
 # @llamaindex/autotool-01-node-example

+## 0.0.11
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+  - @llamaindex/autotool@3.0.2
+
 ## 0.0.10

 ### Patch Changes
@@ -13,5 +13,5 @@
  "scripts": {
    "start": "node --import tsx --import @llamaindex/autotool/node ./src/index.ts"
  },
-  "version": "0.0.10"
+  "version": "0.0.11"
 }
@@ -1,5 +1,13 @@
 # @llamaindex/autotool-02-next-example

+## 0.1.55
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+  - @llamaindex/autotool@3.0.2
+
 ## 0.1.54

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/autotool-02-next-example",
  "private": true,
-  "version": "0.1.54",
+  "version": "0.1.55",
  "scripts": {
    "dev": "next dev",
    "build": "next build",
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/autotool",
  "type": "module",
-  "version": "3.0.1",
+  "version": "3.0.2",
  "description": "auto transpile your JS function to LLM Agent compatible",
  "files": [
    "dist",
@@ -1,5 +1,13 @@
 # @llamaindex/cloud

+## 0.2.6
+
+### Patch Changes
+
+- b42adeb: fix: get job result in llama parse reader
+- Updated dependencies [749b43a]
+  - @llamaindex/core@0.2.2
+
 ## 0.2.5

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "@llamaindex/cloud",
-  "version": "0.2.5",
+  "version": "0.2.6",
  "type": "module",
  "license": "MIT",
  "scripts": {
@@ -50,12 +50,12 @@
  "devDependencies": {
    "@hey-api/client-fetch": "^0.2.4",
    "@hey-api/openapi-ts": "^0.53.0",
-    "@llamaindex/core": "workspace:^0.2.1",
+    "@llamaindex/core": "workspace:^0.2.2",
    "@llamaindex/env": "workspace:^0.1.11",
    "bunchee": "5.3.2"
  },
  "peerDependencies": {
-    "@llamaindex/core": "workspace:^0.2.1",
+    "@llamaindex/core": "workspace:^0.2.2",
    "@llamaindex/env": "workspace:^0.1.11"
  },
  "dependencies": {
@@ -294,17 +294,14 @@ export class LlamaParseReader extends FileReader {
      await sleep(this.checkInterval * 1000);

      // Check the job status. If unsuccessful response, checks if maximum timeout has been reached. If reached, throws an error
-      const result =
-        await ParsingService.getParsingJobDetailsApiV1ParsingJobJobIdDetailsGet(
-          {
-            client: this.#client,
-            throwOnError: true,
-            path: {
-              job_id: jobId,
-            },
-            signal,
-          },
-        );
+      const result = await ParsingService.getJobApiV1ParsingJobJobIdGet({
+        client: this.#client,
+        throwOnError: true,
+        path: {
+          job_id: jobId,
+        },
+        signal,
+      });
      const { data } = result;

      const status = (data as Record<string, unknown>)["status"];
@@ -1,5 +1,12 @@
 # @llamaindex/community

+## 0.0.36
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - @llamaindex/core@0.2.2
+
 ## 0.0.35

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/community",
  "description": "Community package for LlamaIndexTS",
-  "version": "0.0.35",
+  "version": "0.0.36",
  "type": "module",
  "types": "dist/type/index.d.ts",
  "main": "dist/cjs/index.js",
@@ -1,5 +1,11 @@
 # @llamaindex/core

+## 0.2.2
+
+### Patch Changes
+
+- 749b43a: fix: clip embedding transform function
+
 ## 0.2.1

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/core",
  "type": "module",
-  "version": "0.2.1",
+  "version": "0.2.2",
  "description": "LlamaIndex Core Module",
  "exports": {
    "./node-parser": {
@@ -157,6 +157,34 @@
        "types": "./dist/workflow/index.d.ts",
        "default": "./dist/workflow/index.js"
      }
+    },
+    "./memory": {
+      "require": {
+        "types": "./dist/memory/index.d.cts",
+        "default": "./dist/memory/index.cjs"
+      },
+      "import": {
+        "types": "./dist/memory/index.d.ts",
+        "default": "./dist/memory/index.js"
+      },
+      "default": {
+        "types": "./dist/memory/index.d.ts",
+        "default": "./dist/memory/index.js"
+      }
+    },
+    "./storage/chat-store": {
+      "require": {
+        "types": "./dist/storage/chat-store/index.d.cts",
+        "default": "./dist/storage/chat-store/index.cjs"
+      },
+      "import": {
+        "types": "./dist/storage/chat-store/index.d.ts",
+        "default": "./dist/storage/chat-store/index.js"
+      },
+      "default": {
+        "types": "./dist/storage/chat-store/index.d.ts",
+        "default": "./dist/storage/chat-store/index.js"
+      }
    }
  },
  "files": [
@@ -23,23 +23,34 @@ export abstract class BaseEmbedding extends TransformComponent {
  embedBatchSize = DEFAULT_EMBED_BATCH_SIZE;
  embedInfo?: EmbeddingInfo;

-  constructor() {
-    super(
-      async (
-        nodes: BaseNode[],
-        options?: BaseEmbeddingOptions,
-      ): Promise<BaseNode[]> => {
-        const texts = nodes.map((node) => node.getContent(MetadataMode.EMBED));
+  protected constructor(
+    transformFn?: (
+      nodes: BaseNode[],
+      options?: BaseEmbeddingOptions,
+    ) => Promise<BaseNode[]>,
+  ) {
+    if (transformFn) {
+      super(transformFn);
+    } else {
+      super(
+        async (
+          nodes: BaseNode[],
+          options?: BaseEmbeddingOptions,
+        ): Promise<BaseNode[]> => {
+          const texts = nodes.map((node) =>
+            node.getContent(MetadataMode.EMBED),
+          );

-        const embeddings = await this.getTextEmbeddingsBatch(texts, options);
+          const embeddings = await this.getTextEmbeddingsBatch(texts, options);

-        for (let i = 0; i < nodes.length; i++) {
-          nodes[i]!.embedding = embeddings[i];
-        }
+          for (let i = 0; i < nodes.length; i++) {
+            nodes[i]!.embedding = embeddings[i];
+          }

-        return nodes;
-      },
-    );
+          return nodes;
+        },
+      );
+    }
  }

  similarity(
@@ -1,4 +1,5 @@
 export { BaseEmbedding, batchEmbeddings } from "./base";
 export type { BaseEmbeddingOptions, EmbeddingInfo } from "./base";
+export { MultiModalEmbedding } from "./muti-model";
 export { truncateMaxTokens } from "./tokenizer";
 export { DEFAULT_SIMILARITY_TOP_K, SimilarityType, similarity } from "./utils";
@@ -0,0 +1,81 @@
+import type { MessageContentDetail } from "../llms";
+import {
+  ImageNode,
+  MetadataMode,
+  ModalityType,
+  splitNodesByType,
+  type BaseNode,
+  type ImageType,
+} from "../schema";
+import { extractImage, extractSingleText } from "../utils";
+import {
+  BaseEmbedding,
+  batchEmbeddings,
+  type BaseEmbeddingOptions,
+} from "./base";
+
+/*
+ * Base class for Multi Modal embeddings.
+ */
+export abstract class MultiModalEmbedding extends BaseEmbedding {
+  abstract getImageEmbedding(images: ImageType): Promise<number[]>;
+
+  protected constructor() {
+    super(
+      async (
+        nodes: BaseNode[],
+        options?: BaseEmbeddingOptions,
+      ): Promise<BaseNode[]> => {
+        const nodeMap = splitNodesByType(nodes);
+        const imageNodes = nodeMap[ModalityType.IMAGE] ?? [];
+        const textNodes = nodeMap[ModalityType.TEXT] ?? [];
+
+        const embeddings = await batchEmbeddings(
+          textNodes.map((node) => node.getContent(MetadataMode.EMBED)),
+          this.getTextEmbeddings.bind(this),
+          this.embedBatchSize,
+          options,
+        );
+        for (let i = 0; i < textNodes.length; i++) {
+          textNodes[i]!.embedding = embeddings[i];
+        }
+
+        const imageEmbeddings = await batchEmbeddings(
+          imageNodes.map((n) => (n as ImageNode).image),
+          this.getImageEmbeddings.bind(this),
+          this.embedBatchSize,
+          options,
+        );
+        for (let i = 0; i < imageNodes.length; i++) {
+          imageNodes[i]!.embedding = imageEmbeddings[i];
+        }
+
+        return nodes;
+      },
+    );
+  }
+
+  /**
+   * Optionally override this method to retrieve multiple image embeddings in a single request
+   * @param images
+   */
+  async getImageEmbeddings(images: ImageType[]): Promise<number[][]> {
+    return Promise.all(
+      images.map((imgFilePath) => this.getImageEmbedding(imgFilePath)),
+    );
+  }
+
+  async getQueryEmbedding(
+    query: MessageContentDetail,
+  ): Promise<number[] | null> {
+    const image = extractImage(query);
+    if (image) {
+      return await this.getImageEmbedding(image);
+    }
+    const text = extractSingleText(query);
+    if (text) {
+      return await this.getTextEmbedding(text);
+    }
+    return null;
+  }
+}
@@ -0,0 +1,62 @@
+import { Settings } from "../global";
+import type { ChatMessage, MessageContent } from "../llms";
+import { type BaseChatStore, SimpleChatStore } from "../storage/chat-store";
+import { extractText } from "../utils";
+
+export const DEFAULT_TOKEN_LIMIT_RATIO = 0.75;
+export const DEFAULT_CHAT_STORE_KEY = "chat_history";
+
+/**
+ * A ChatMemory is used to keep the state of back and forth chat messages
+ */
+export abstract class BaseMemory<
+  AdditionalMessageOptions extends object = object,
+> {
+  abstract getMessages(
+    input?: MessageContent | undefined,
+  ):
+    | ChatMessage<AdditionalMessageOptions>[]
+    | Promise<ChatMessage<AdditionalMessageOptions>[]>;
+  abstract getAllMessages():
+    | ChatMessage<AdditionalMessageOptions>[]
+    | Promise<ChatMessage<AdditionalMessageOptions>[]>;
+  abstract put(messages: ChatMessage<AdditionalMessageOptions>): void;
+  abstract reset(): void;
+
+  protected _tokenCountForMessages(messages: ChatMessage[]): number {
+    if (messages.length === 0) {
+      return 0;
+    }
+
+    const tokenizer = Settings.tokenizer;
+    const str = messages.map((m) => extractText(m.content)).join(" ");
+    return tokenizer.encode(str).length;
+  }
+}
+
+export abstract class BaseChatStoreMemory<
+  AdditionalMessageOptions extends object = object,
+> extends BaseMemory<AdditionalMessageOptions> {
+  protected constructor(
+    public chatStore: BaseChatStore<AdditionalMessageOptions> = new SimpleChatStore<AdditionalMessageOptions>(),
+    public chatStoreKey: string = DEFAULT_CHAT_STORE_KEY,
+  ) {
+    super();
+  }
+
+  getAllMessages(): ChatMessage<AdditionalMessageOptions>[] {
+    return this.chatStore.getMessages(this.chatStoreKey);
+  }
+
+  put(messages: ChatMessage<AdditionalMessageOptions>) {
+    this.chatStore.addMessage(this.chatStoreKey, messages);
+  }
+
+  set(messages: ChatMessage<AdditionalMessageOptions>[]) {
+    this.chatStore.setMessages(this.chatStoreKey, messages);
+  }
+
+  reset() {
+    this.chatStore.deleteMessages(this.chatStoreKey);
+  }
+}
@@ -0,0 +1,65 @@
+import { Settings } from "../global";
+import type { ChatMessage, LLM, MessageContent } from "../llms";
+import { type BaseChatStore } from "../storage/chat-store";
+import { BaseChatStoreMemory, DEFAULT_TOKEN_LIMIT_RATIO } from "./base";
+
+type ChatMemoryBufferOptions<AdditionalMessageOptions extends object = object> =
+  {
+    tokenLimit?: number | undefined;
+    chatStore?: BaseChatStore<AdditionalMessageOptions> | undefined;
+    chatStoreKey?: string | undefined;
+    chatHistory?: ChatMessage<AdditionalMessageOptions>[] | undefined;
+    llm?: LLM<object, AdditionalMessageOptions> | undefined;
+  };
+
+export class ChatMemoryBuffer<
+  AdditionalMessageOptions extends object = object,
+> extends BaseChatStoreMemory<AdditionalMessageOptions> {
+  tokenLimit: number;
+
+  constructor(
+    options?: Partial<ChatMemoryBufferOptions<AdditionalMessageOptions>>,
+  ) {
+    super(options?.chatStore, options?.chatStoreKey);
+
+    const llm = options?.llm ?? Settings.llm;
+    const contextWindow = llm.metadata.contextWindow;
+    this.tokenLimit =
+      options?.tokenLimit ??
+      Math.ceil(contextWindow * DEFAULT_TOKEN_LIMIT_RATIO);
+
+    if (options?.chatHistory) {
+      this.chatStore.setMessages(this.chatStoreKey, options.chatHistory);
+    }
+  }
+
+  getMessages(
+    input?: MessageContent | undefined,
+    initialTokenCount: number = 0,
+  ) {
+    const messages = this.getAllMessages();
+
+    if (initialTokenCount > this.tokenLimit) {
+      throw new Error("Initial token count exceeds token limit");
+    }
+
+    let messageCount = messages.length;
+    let currentMessages = messages.slice(-messageCount);
+    let tokenCount = this._tokenCountForMessages(messages) + initialTokenCount;
+
+    while (tokenCount > this.tokenLimit && messageCount > 1) {
+      messageCount -= 1;
+      if (messages.at(-messageCount)!.role === "assistant") {
+        messageCount -= 1;
+      }
+      currentMessages = messages.slice(-messageCount);
+      tokenCount =
+        this._tokenCountForMessages(currentMessages) + initialTokenCount;
+    }
+
+    if (tokenCount > this.tokenLimit && messageCount <= 0) {
+      return [];
+    }
+    return messages.slice(-messageCount);
+  }
+}
@@ -0,0 +1,3 @@
+export { BaseMemory } from "./base";
+export { ChatMemoryBuffer } from "./chat-memory-buffer";
+export { ChatSummaryMemoryBuffer } from "./summary-memory";
@@ -1,73 +1,11 @@
-import type { ChatMessage, LLM, MessageType } from "@llamaindex/core/llms";
-import {
-  defaultSummaryPrompt,
-  type SummaryPrompt,
-} from "@llamaindex/core/prompts";
-import { extractText, messagesToHistory } from "@llamaindex/core/utils";
-import { tokenizers, type Tokenizer } from "@llamaindex/env";
-import { OpenAI } from "@llamaindex/openai";
+import { type Tokenizer, tokenizers } from "@llamaindex/env";
+import { Settings } from "../global";
+import type { ChatMessage, LLM, MessageType } from "../llms";
+import { defaultSummaryPrompt, type SummaryPrompt } from "../prompts";
+import { extractText, messagesToHistory } from "../utils";
+import { BaseMemory } from "./base";

-/**
- * A ChatHistory is used to keep the state of back and forth chat messages
- */
-export abstract class ChatHistory<
-  AdditionalMessageOptions extends object = object,
-> {
-  abstract get messages(): ChatMessage<AdditionalMessageOptions>[];
-  /**
-   * Adds a message to the chat history.
-   * @param message
-   */
-  abstract addMessage(message: ChatMessage<AdditionalMessageOptions>): void;
-
-  /**
-   * Returns the messages that should be used as input to the LLM.
-   */
-  abstract requestMessages(
-    transientMessages?: ChatMessage<AdditionalMessageOptions>[],
-  ): Promise<ChatMessage<AdditionalMessageOptions>[]>;
-
-  /**
-   * Resets the chat history so that it's empty.
-   */
-  abstract reset(): void;
-
-  /**
-   * Returns the new messages since the last call to this function (or since calling the constructor)
-   */
-  abstract newMessages(): ChatMessage<AdditionalMessageOptions>[];
-}
-
-export class SimpleChatHistory extends ChatHistory {
-  messages: ChatMessage[];
-  private messagesBefore: number;
-
-  constructor(init?: { messages?: ChatMessage[] | undefined }) {
-    super();
-    this.messages = init?.messages ?? [];
-    this.messagesBefore = this.messages.length;
-  }
-
-  addMessage(message: ChatMessage) {
-    this.messages.push(message);
-  }
-
-  async requestMessages(transientMessages?: ChatMessage[]) {
-    return [...(transientMessages ?? []), ...this.messages];
-  }
-
-  reset() {
-    this.messages = [];
-  }
-
-  newMessages() {
-    const newMessages = this.messages.slice(this.messagesBefore);
-    this.messagesBefore = this.messages.length;
-    return newMessages;
-  }
-}
-
-export class SummaryChatHistory extends ChatHistory {
+export class ChatSummaryMemoryBuffer extends BaseMemory {
  /**
   * Tokenizer function that converts text to tokens,
   *  this is used to calculate the number of tokens in a message.
@@ -77,20 +15,18 @@ export class SummaryChatHistory extends ChatHistory {
  messages: ChatMessage[];
  summaryPrompt: SummaryPrompt;
  llm: LLM;
-  private messagesBefore: number;

-  constructor(init?: Partial<SummaryChatHistory>) {
+  constructor(options?: Partial<ChatSummaryMemoryBuffer>) {
    super();
-    this.messages = init?.messages ?? [];
-    this.messagesBefore = this.messages.length;
-    this.summaryPrompt = init?.summaryPrompt ?? defaultSummaryPrompt;
-    this.llm = init?.llm ?? new OpenAI();
+    this.messages = options?.messages ?? [];
+    this.summaryPrompt = options?.summaryPrompt ?? defaultSummaryPrompt;
+    this.llm = options?.llm ?? Settings.llm;
    if (!this.llm.metadata.maxTokens) {
      throw new Error(
        "LLM maxTokens is not set. Needed so the summarizer ensures the context window size of the LLM.",
      );
    }
-    this.tokenizer = init?.tokenizer ?? tokenizers.tokenizer();
+    this.tokenizer = options?.tokenizer ?? tokenizers.tokenizer();
    this.tokensToSummarize =
      this.llm.metadata.contextWindow - this.llm.metadata.maxTokens;
    if (this.tokensToSummarize < this.llm.metadata.contextWindow * 0.25) {
@@ -128,12 +64,8 @@ export class SummaryChatHistory extends ChatHistory {
    return { content: response.message.content, role: "memory" };
  }

-  addMessage(message: ChatMessage) {
-    this.messages.push(message);
-  }
-
  // Find last summary message
-  private getLastSummaryIndex(): number | null {
+  private get lastSummaryIndex(): number | null {
    const reversedMessages = this.messages.slice().reverse();
    const index = reversedMessages.findIndex(
      (message) => message.role === "memory",
@@ -145,7 +77,7 @@ export class SummaryChatHistory extends ChatHistory {
  }

  public getLastSummary(): ChatMessage | null {
-    const lastSummaryIndex = this.getLastSummaryIndex();
+    const lastSummaryIndex = this.lastSummaryIndex;
    return lastSummaryIndex ? this.messages[lastSummaryIndex]! : null;
  }

@@ -165,7 +97,7 @@ export class SummaryChatHistory extends ChatHistory {
   * If there's a memory, uses all messages after the last summary message.
   */
  private calcConversationMessages(transformSummary?: boolean): ChatMessage[] {
-    const lastSummaryIndex = this.getLastSummaryIndex();
+    const lastSummaryIndex = this.lastSummaryIndex;
    if (!lastSummaryIndex) {
      // there's no memory, so just use all non-system messages
      return this.nonSystemMessages;
@@ -182,18 +114,18 @@ export class SummaryChatHistory extends ChatHistory {
    }
  }

-  private calcCurrentRequestMessages(transientMessages?: ChatMessage[]) {
+  private calcCurrentRequestMessages() {
    // TODO: check order: currently, we're sending:
    // system messages first, then transient messages and then the messages that describe the conversation so far
-    return [
-      ...this.systemMessages,
-      ...(transientMessages ? transientMessages : []),
-      ...this.calcConversationMessages(true),
-    ];
+    return [...this.systemMessages, ...this.calcConversationMessages(true)];
  }

-  async requestMessages(transientMessages?: ChatMessage[]) {
-    const requestMessages = this.calcCurrentRequestMessages(transientMessages);
+  reset() {
+    this.messages = [];
+  }
+
+  async getMessages(): Promise<ChatMessage[]> {
+    const requestMessages = this.calcCurrentRequestMessages();

    // get tokens of current request messages and the transient messages
    const tokens = requestMessages.reduce(
@@ -217,27 +149,16 @@ export class SummaryChatHistory extends ChatHistory {
      // TODO: we still might have too many tokens
      // e.g. too large system messages or transient messages
      // how should we deal with that?
-      return this.calcCurrentRequestMessages(transientMessages);
+      return this.calcCurrentRequestMessages();
    }
    return requestMessages;
  }

-  reset() {
-    this.messages = [];
+  async getAllMessages(): Promise<ChatMessage[]> {
+    return this.getMessages();
  }

-  newMessages() {
-    const newMessages = this.messages.slice(this.messagesBefore);
-    this.messagesBefore = this.messages.length;
-    return newMessages;
+  put(message: ChatMessage) {
+    this.messages.push(message);
  }
 }
-
-export function getHistory(
-  chatHistory?: ChatMessage[] | ChatHistory,
-): ChatHistory {
-  if (chatHistory instanceof ChatHistory) {
-    return chatHistory;
-  }
-  return new SimpleChatHistory({ messages: chatHistory });
-}
@@ -0,0 +1,19 @@
+import type { ChatMessage } from "../../llms";
+
+export abstract class BaseChatStore<
+  AdditionalMessageOptions extends object = object,
+> {
+  abstract setMessages(
+    key: string,
+    messages: ChatMessage<AdditionalMessageOptions>[],
+  ): void;
+  abstract getMessages(key: string): ChatMessage<AdditionalMessageOptions>[];
+  abstract addMessage(
+    key: string,
+    message: ChatMessage<AdditionalMessageOptions>,
+    idx?: number,
+  ): void;
+  abstract deleteMessages(key: string): void;
+  abstract deleteMessage(key: string, idx: number): void;
+  abstract getKeys(): IterableIterator<string>;
+}
@@ -0,0 +1,2 @@
+export { BaseChatStore } from "./base-chat-store";
+export { SimpleChatStore } from "./simple-chat-store";
@@ -0,0 +1,43 @@
+import type { ChatMessage } from "../../llms";
+import { BaseChatStore } from "./base-chat-store";
+
+export class SimpleChatStore<
+  AdditionalMessageOptions extends object = object,
+> extends BaseChatStore<AdditionalMessageOptions> {
+  #store = new Map<string, ChatMessage<AdditionalMessageOptions>[]>();
+  setMessages(key: string, messages: ChatMessage<AdditionalMessageOptions>[]) {
+    this.#store.set(key, messages);
+  }
+
+  getMessages(key: string) {
+    return this.#store.get(key) ?? [];
+  }
+
+  addMessage(
+    key: string,
+    message: ChatMessage<AdditionalMessageOptions>,
+    idx?: number,
+  ) {
+    const messages = this.#store.get(key) ?? [];
+    if (idx === undefined) {
+      messages.push(message);
+    } else {
+      messages.splice(idx, 0, message);
+    }
+    this.#store.set(key, messages);
+  }
+
+  deleteMessages(key: string) {
+    this.#store.delete(key);
+  }
+
+  deleteMessage(key: string, idx: number) {
+    const messages = this.#store.get(key) ?? [];
+    messages.splice(idx, 1);
+    this.#store.set(key, messages);
+  }
+
+  getKeys() {
+    return this.#store.keys();
+  }
+}
@@ -1,5 +1,12 @@
 # @llamaindex/experimental

+## 0.0.80
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.0.79

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/experimental",
  "description": "Experimental package for LlamaIndexTS",
-  "version": "0.0.79",
+  "version": "0.0.80",
  "type": "module",
  "types": "dist/type/index.d.ts",
  "main": "dist/cjs/index.js",
@@ -1,5 +1,17 @@
 # llamaindex

+## 0.6.2
+
+### Patch Changes
+
+- 749b43a: fix: clip embedding transform function
+- Updated dependencies [b42adeb]
+- Updated dependencies [749b43a]
+  - @llamaindex/cloud@0.2.6
+  - @llamaindex/core@0.2.2
+  - @llamaindex/openai@0.1.4
+  - @llamaindex/groq@0.0.3
+
 ## 0.6.1

 ### Patch Changes
@@ -1,5 +1,12 @@
 # @llamaindex/cloudflare-worker-agent-test

+## 0.0.64
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.0.63

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "@llamaindex/cloudflare-worker-agent-test",
-  "version": "0.0.63",
+  "version": "0.0.64",
  "type": "module",
  "private": true,
  "scripts": {
@@ -1,5 +1,12 @@
 # @llamaindex/llama-parse-browser-test

+## 0.0.2
+
+### Patch Changes
+
+- Updated dependencies [b42adeb]
+  - @llamaindex/cloud@0.2.6
+
 ## 0.0.1

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/llama-parse-browser-test",
  "private": true,
-  "version": "0.0.1",
+  "version": "0.0.2",
  "type": "module",
  "scripts": {
    "dev": "vite",
@@ -1,5 +1,12 @@
 # @llamaindex/next-agent-test

+## 0.1.64
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.1.63

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "@llamaindex/next-agent-test",
-  "version": "0.1.63",
+  "version": "0.1.64",
  "private": true,
  "scripts": {
    "dev": "next dev",
@@ -1,5 +1,12 @@
 # test-edge-runtime

+## 0.1.63
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.1.62

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "@llamaindex/nextjs-edge-runtime-test",
-  "version": "0.1.62",
+  "version": "0.1.63",
  "private": true,
  "scripts": {
    "dev": "next dev",
@@ -1,5 +1,12 @@
 # @llamaindex/next-node-runtime

+## 0.0.45
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.0.44

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "@llamaindex/next-node-runtime-test",
-  "version": "0.0.44",
+  "version": "0.0.45",
  "private": true,
  "scripts": {
    "dev": "next dev",
@@ -1,5 +1,12 @@
 # @llamaindex/waku-query-engine-test

+## 0.0.64
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - llamaindex@0.6.2
+
 ## 0.0.63

 ### Patch Changes
@@ -1,6 +1,6 @@
 {
  "name": "@llamaindex/waku-query-engine-test",
-  "version": "0.0.63",
+  "version": "0.0.64",
  "type": "module",
  "private": true,
  "scripts": {
@@ -0,0 +1,30 @@
+import { ClipEmbedding, ImageNode } from "llamaindex";
+import assert from "node:assert";
+import { test } from "node:test";
+
+await test("clip embedding", async (t) => {
+  await t.test("init & get image embedding", async () => {
+    const clipEmbedding = new ClipEmbedding();
+    const imgUrl = new URL(
+      "../../fixtures/img/llamaindex-white.png",
+      import.meta.url,
+    );
+    const vec = await clipEmbedding.getImageEmbedding(imgUrl);
+    assert.ok(vec);
+  });
+
+  await t.test("load image document", async () => {
+    const nodes = [
+      new ImageNode({
+        image: new URL(
+          "../../fixtures/img/llamaindex-white.png",
+          import.meta.url,
+        ),
+      }),
+    ];
+    const clipEmbedding = new ClipEmbedding();
+    const result = await clipEmbedding(nodes);
+    assert.strictEqual(result.length, 1);
+    assert.ok(result[0]!.embedding);
+  });
+});
@@ -1,6 +1,6 @@
 {
  "name": "llamaindex",
-  "version": "0.6.1",
+  "version": "0.6.2",
  "license": "MIT",
  "type": "module",
  "keywords": [
@@ -5,10 +5,10 @@ import type {
  MessageContent,
  ToolOutput,
 } from "@llamaindex/core/llms";
+import { BaseMemory } from "@llamaindex/core/memory";
 import { EngineResponse } from "@llamaindex/core/schema";
 import { wrapEventCaller } from "@llamaindex/core/utils";
 import { randomUUID } from "@llamaindex/env";
-import { ChatHistory } from "../ChatHistory.js";
 import { Settings } from "../Settings.js";
 import {
  type ChatEngine,
@@ -353,11 +353,12 @@ export abstract class AgentRunner<
  async chat(
    params: ChatEngineParamsNonStreaming | ChatEngineParamsStreaming,
  ): Promise<EngineResponse | ReadableStream<EngineResponse>> {
-    let chatHistory: ChatMessage<AdditionalMessageOptions>[] | undefined = [];
+    let chatHistory: ChatMessage<AdditionalMessageOptions>[] = [];

-    if (params.chatHistory instanceof ChatHistory) {
-      chatHistory = params.chatHistory
-        .messages as ChatMessage<AdditionalMessageOptions>[];
+    if (params.chatHistory instanceof BaseMemory) {
+      chatHistory = (await params.chatHistory.getMessages(
+        params.message,
+      )) as ChatMessage<AdditionalMessageOptions>[];
    } else {
      chatHistory =
        params.chatHistory as ChatMessage<AdditionalMessageOptions>[];
@@ -1,7 +1,7 @@
+import { MultiModalEmbedding } from "@llamaindex/core/embeddings";
 import type { ImageType } from "@llamaindex/core/schema";
 import _ from "lodash";
 import { lazyLoadTransformers } from "../internal/deps/transformers.js";
-import { MultiModalEmbedding } from "./MultiModalEmbedding.js";
 // only import type, to avoid bundling error
 import type {
  CLIPTextModelWithProjection,
@@ -35,6 +35,10 @@ export class ClipEmbedding extends MultiModalEmbedding {
  private visionModel: CLIPVisionModelWithProjection | null = null;
  private textModel: CLIPTextModelWithProjection | null = null;

+  constructor() {
+    super();
+  }
+
  async getTokenizer() {
    const { AutoTokenizer } = await lazyLoadTransformers();
    if (!this.tokenizer) {
@@ -1,10 +1,13 @@
+import { MultiModalEmbedding } from "@llamaindex/core/embeddings";
 import type { ImageType } from "@llamaindex/core/schema";
-import { MultiModalEmbedding } from "./MultiModalEmbedding.js";

 /**
 * Cloudflare worker doesn't support image embeddings for now
 */
 export class CloudflareWorkerMultiModalEmbedding extends MultiModalEmbedding {
+  constructor() {
+    super();
+  }
  getImageEmbedding(images: ImageType): Promise<number[]> {
    throw new Error("Method not implemented.");
  }
@@ -1,7 +1,7 @@
+import { MultiModalEmbedding } from "@llamaindex/core/embeddings";
 import { getEnv } from "@llamaindex/env";
 import { imageToDataUrl } from "../internal/utils.js";
 import type { ImageType } from "../Node.js";
-import { MultiModalEmbedding } from "./MultiModalEmbedding.js";

 function isLocal(url: ImageType): boolean {
  if (url instanceof Blob) return true;
@@ -1,71 +0,0 @@
-import { BaseEmbedding, batchEmbeddings } from "@llamaindex/core/embeddings";
-import type { MessageContentDetail } from "@llamaindex/core/llms";
-import {
-  ImageNode,
-  MetadataMode,
-  ModalityType,
-  splitNodesByType,
-  type BaseNode,
-  type ImageType,
-} from "@llamaindex/core/schema";
-import { extractImage, extractSingleText } from "@llamaindex/core/utils";
-
-/*
- * Base class for Multi Modal embeddings.
- */
-
-export abstract class MultiModalEmbedding extends BaseEmbedding {
-  abstract getImageEmbedding(images: ImageType): Promise<number[]>;
-
-  /**
-   * Optionally override this method to retrieve multiple image embeddings in a single request
-   * @param images
-   */
-  async getImageEmbeddings(images: ImageType[]): Promise<number[][]> {
-    return Promise.all(
-      images.map((imgFilePath) => this.getImageEmbedding(imgFilePath)),
-    );
-  }
-
-  async transform(nodes: BaseNode[], _options?: any): Promise<BaseNode[]> {
-    const nodeMap = splitNodesByType(nodes);
-    const imageNodes = nodeMap[ModalityType.IMAGE] ?? [];
-    const textNodes = nodeMap[ModalityType.TEXT] ?? [];
-
-    const embeddings = await batchEmbeddings(
-      textNodes.map((node) => node.getContent(MetadataMode.EMBED)),
-      this.getTextEmbeddings.bind(this),
-      this.embedBatchSize,
-      _options,
-    );
-    for (let i = 0; i < textNodes.length; i++) {
-      textNodes[i]!.embedding = embeddings[i];
-    }
-
-    const imageEmbeddings = await batchEmbeddings(
-      imageNodes.map((n) => (n as ImageNode).image),
-      this.getImageEmbeddings.bind(this),
-      this.embedBatchSize,
-      _options,
-    );
-    for (let i = 0; i < imageNodes.length; i++) {
-      imageNodes[i]!.embedding = imageEmbeddings[i];
-    }
-
-    return nodes;
-  }
-
-  async getQueryEmbedding(
-    query: MessageContentDetail,
-  ): Promise<number[] | null> {
-    const image = extractImage(query);
-    if (image) {
-      return await this.getImageEmbedding(image);
-    }
-    const text = extractSingleText(query);
-    if (text) {
-      return await this.getTextEmbedding(text);
-    }
-    return null;
-  }
-}
@@ -6,7 +6,6 @@ export { HuggingFaceInferenceAPIEmbedding } from "./HuggingFaceEmbedding.js";
 export * from "./JinaAIEmbedding.js";
 export * from "./MistralAIEmbedding.js";
 export * from "./MixedbreadAIEmbeddings.js";
-export * from "./MultiModalEmbedding.js";
 export { OllamaEmbedding } from "./OllamaEmbedding.js";
 export * from "./OpenAIEmbedding.js";
 export { TogetherEmbedding } from "./together.js";
@@ -1,4 +1,5 @@
 import type { ChatMessage, LLM } from "@llamaindex/core/llms";
+import { BaseMemory, ChatMemoryBuffer } from "@llamaindex/core/memory";
 import {
  type CondenseQuestionPrompt,
  defaultCondenseQuestionPrompt,
@@ -12,8 +13,6 @@ import {
  streamReducer,
  wrapEventCaller,
 } from "@llamaindex/core/utils";
-import type { ChatHistory } from "../../ChatHistory.js";
-import { getHistory } from "../../ChatHistory.js";
 import type { ServiceContext } from "../../ServiceContext.js";
 import { llmFromSettingsOrContext } from "../../Settings.js";
 import type { QueryEngine } from "../../types.js";
@@ -39,7 +38,7 @@ export class CondenseQuestionChatEngine
  implements ChatEngine
 {
  queryEngine: QueryEngine;
-  chatHistory: ChatHistory;
+  chatHistory: BaseMemory;
  llm: LLM;
  condenseMessagePrompt: CondenseQuestionPrompt;

@@ -52,7 +51,9 @@ export class CondenseQuestionChatEngine
    super();

    this.queryEngine = init.queryEngine;
-    this.chatHistory = getHistory(init?.chatHistory);
+    this.chatHistory = new ChatMemoryBuffer({
+      chatHistory: init?.chatHistory,
+    });
    this.llm = llmFromSettingsOrContext(init?.serviceContext);
    this.condenseMessagePrompt =
      init?.condenseMessagePrompt ?? defaultCondenseQuestionPrompt;
@@ -76,9 +77,9 @@ export class CondenseQuestionChatEngine
    }
  }

-  private async condenseQuestion(chatHistory: ChatHistory, question: string) {
+  private async condenseQuestion(chatHistory: BaseMemory, question: string) {
    const chatHistoryStr = messagesToHistory(
-      await chatHistory.requestMessages(),
+      await chatHistory.getMessages(question),
    );

    return this.llm.complete({
@@ -99,13 +100,18 @@ export class CondenseQuestionChatEngine
  ): Promise<EngineResponse | AsyncIterable<EngineResponse>> {
    const { message, stream } = params;
    const chatHistory = params.chatHistory
-      ? getHistory(params.chatHistory)
+      ? new ChatMemoryBuffer({
+          chatHistory:
+            params.chatHistory instanceof BaseMemory
+              ? await params.chatHistory.getMessages(message)
+              : params.chatHistory,
+        })
      : this.chatHistory;

    const condensedQuestion = (
      await this.condenseQuestion(chatHistory, extractText(message))
    ).text;
-    chatHistory.addMessage({ content: message, role: "user" });
+    chatHistory.put({ content: message, role: "user" });

    if (stream) {
      const stream = await this.queryEngine.query({
@@ -118,14 +124,14 @@ export class CondenseQuestionChatEngine
        reducer: (accumulator, part) =>
          (accumulator += extractText(part.message.content)),
        finished: (accumulator) => {
-          chatHistory.addMessage({ content: accumulator, role: "assistant" });
+          chatHistory.put({ content: accumulator, role: "assistant" });
        },
      });
    }
    const response = await this.queryEngine.query({
      query: condensedQuestion,
    });
-    chatHistory.addMessage({
+    chatHistory.put({
      content: response.message.content,
      role: "assistant",
    });
@@ -4,6 +4,7 @@ import type {
  MessageContent,
  MessageType,
 } from "@llamaindex/core/llms";
+import { BaseMemory, ChatMemoryBuffer } from "@llamaindex/core/memory";
 import {
  type ContextSystemPrompt,
  type ModuleRecord,
@@ -17,8 +18,6 @@ import {
  streamReducer,
  wrapEventCaller,
 } from "@llamaindex/core/utils";
-import type { ChatHistory } from "../../ChatHistory.js";
-import { getHistory } from "../../ChatHistory.js";
 import type { BaseRetriever } from "../../Retriever.js";
 import { Settings } from "../../Settings.js";
 import type { BaseNodePostprocessor } from "../../postprocessors/index.js";
@@ -36,7 +35,7 @@ import type {
 */
 export class ContextChatEngine extends PromptMixin implements ChatEngine {
  chatModel: LLM;
-  chatHistory: ChatHistory;
+  chatHistory: BaseMemory;
  contextGenerator: ContextGenerator & PromptMixin;
  systemPrompt?: string | undefined;

@@ -51,7 +50,7 @@ export class ContextChatEngine extends PromptMixin implements ChatEngine {
  }) {
    super();
    this.chatModel = init.chatModel ?? Settings.llm;
-    this.chatHistory = getHistory(init?.chatHistory);
+    this.chatHistory = new ChatMemoryBuffer({ chatHistory: init?.chatHistory });
    this.contextGenerator = new DefaultContextGenerator({
      retriever: init.retriever,
      contextSystemPrompt: init?.contextSystemPrompt,
@@ -90,7 +89,12 @@ export class ContextChatEngine extends PromptMixin implements ChatEngine {
  ): Promise<EngineResponse | AsyncIterable<EngineResponse>> {
    const { message, stream } = params;
    const chatHistory = params.chatHistory
-      ? getHistory(params.chatHistory)
+      ? new ChatMemoryBuffer({
+          chatHistory:
+            params.chatHistory instanceof BaseMemory
+              ? await params.chatHistory.getMessages(message)
+              : params.chatHistory,
+        })
      : this.chatHistory;
    const requestMessages = await this.prepareRequestMessages(
      message,
@@ -107,7 +111,7 @@ export class ContextChatEngine extends PromptMixin implements ChatEngine {
          initialValue: "",
          reducer: (accumulator, part) => (accumulator += part.delta),
          finished: (accumulator) => {
-            chatHistory.addMessage({ content: accumulator, role: "assistant" });
+            chatHistory.put({ content: accumulator, role: "assistant" });
          },
        }),
        (r) => EngineResponse.fromChatResponseChunk(r, requestMessages.nodes),
@@ -116,7 +120,7 @@ export class ContextChatEngine extends PromptMixin implements ChatEngine {
    const response = await this.chatModel.chat({
      messages: requestMessages.messages,
    });
-    chatHistory.addMessage(response.message);
+    chatHistory.put(response.message);
    return EngineResponse.fromChatResponse(response, requestMessages.nodes);
  }

@@ -126,16 +130,16 @@ export class ContextChatEngine extends PromptMixin implements ChatEngine {

  private async prepareRequestMessages(
    message: MessageContent,
-    chatHistory: ChatHistory,
+    chatHistory: BaseMemory,
  ) {
-    chatHistory.addMessage({
+    chatHistory.put({
      content: message,
      role: "user",
    });
    const textOnly = extractText(message);
    const context = await this.contextGenerator.generate(textOnly);
    const systemMessage = this.prependSystemPrompt(context.message);
-    const messages = await chatHistory.requestMessages([systemMessage]);
+    const messages = await chatHistory.getMessages(systemMessage.content);
    return { nodes: context.nodes, messages };
  }

@@ -1,12 +1,11 @@
 import type { LLM } from "@llamaindex/core/llms";
+import { BaseMemory, ChatMemoryBuffer } from "@llamaindex/core/memory";
 import { EngineResponse } from "@llamaindex/core/schema";
 import {
  streamConverter,
  streamReducer,
  wrapEventCaller,
 } from "@llamaindex/core/utils";
-import type { ChatHistory } from "../../ChatHistory.js";
-import { getHistory } from "../../ChatHistory.js";
 import { Settings } from "../../Settings.js";
 import type {
  ChatEngine,
@@ -19,11 +18,11 @@ import type {
 */

 export class SimpleChatEngine implements ChatEngine {
-  chatHistory: ChatHistory;
+  chatHistory: BaseMemory;
  llm: LLM;

  constructor(init?: Partial<SimpleChatEngine>) {
-    this.chatHistory = getHistory(init?.chatHistory);
+    this.chatHistory = init?.chatHistory ?? new ChatMemoryBuffer();
    this.llm = init?.llm ?? Settings.llm;
  }

@@ -38,13 +37,18 @@ export class SimpleChatEngine implements ChatEngine {
    const { message, stream } = params;

    const chatHistory = params.chatHistory
-      ? getHistory(params.chatHistory)
+      ? new ChatMemoryBuffer({
+          chatHistory:
+            params.chatHistory instanceof BaseMemory
+              ? await params.chatHistory.getMessages(message)
+              : params.chatHistory,
+        })
      : this.chatHistory;
-    chatHistory.addMessage({ content: message, role: "user" });
+    chatHistory.put({ content: message, role: "user" });

    if (stream) {
      const stream = await this.llm.chat({
-        messages: await chatHistory.requestMessages(),
+        messages: await chatHistory.getMessages(params.message),
        stream: true,
      });
      return streamConverter(
@@ -53,7 +57,7 @@ export class SimpleChatEngine implements ChatEngine {
          initialValue: "",
          reducer: (accumulator, part) => accumulator + part.delta,
          finished: (accumulator) => {
-            chatHistory.addMessage({ content: accumulator, role: "assistant" });
+            chatHistory.put({ content: accumulator, role: "assistant" });
          },
        }),
        EngineResponse.fromChatResponseChunk,
@@ -61,9 +65,10 @@ export class SimpleChatEngine implements ChatEngine {
    }

    const response = await this.llm.chat({
-      messages: await chatHistory.requestMessages(),
+      stream: false,
+      messages: await chatHistory.getMessages(params.message),
    });
-    chatHistory.addMessage(response.message);
+    chatHistory.put(response.message);
    return EngineResponse.fromChatResponse(response);
  }

@@ -1,6 +1,6 @@
 import type { ChatMessage, MessageContent } from "@llamaindex/core/llms";
+import type { BaseMemory } from "@llamaindex/core/memory";
 import { EngineResponse, type NodeWithScore } from "@llamaindex/core/schema";
-import type { ChatHistory } from "../../ChatHistory.js";

 /**
 * Represents the base parameters for ChatEngine.
@@ -10,7 +10,7 @@ export interface ChatEngineParamsBase {
  /**
   * Optional chat history if you want to customize the chat history.
   */
-  chatHistory?: ChatMessage[] | ChatHistory;
+  chatHistory?: ChatMessage[] | BaseMemory;
  /**
   * Optional flag to enable verbose mode.
   * @default false
@@ -46,9 +46,9 @@ declare module "@llamaindex/core/global" {
 }

 export * from "@llamaindex/core/llms";
+export * from "@llamaindex/core/memory";
 export * from "@llamaindex/core/schema";
 export * from "./agent/index.js";
-export * from "./ChatHistory.js";
 export * from "./cloud/index.js";
 export * from "./embeddings/index.js";
 export * from "./engines/chat/index.js";
@@ -1,107 +0,0 @@
-import type { ChatMessage, LLM } from "@llamaindex/core/llms";
-import type { ChatHistory } from "../ChatHistory.js";
-import { SimpleChatStore } from "../storage/chatStore/SimpleChatStore.js";
-import type { BaseChatStore } from "../storage/chatStore/types.js";
-import type { BaseMemory } from "./types.js";
-
-const DEFAULT_TOKEN_LIMIT_RATIO = 0.75;
-const DEFAULT_TOKEN_LIMIT = 3000;
-
-type ChatMemoryBufferParams<AdditionalMessageOptions extends object = object> =
-  {
-    tokenLimit?: number;
-    chatStore?: BaseChatStore<AdditionalMessageOptions>;
-    chatStoreKey?: string;
-    chatHistory?: ChatHistory<AdditionalMessageOptions>;
-    llm?: LLM<object, AdditionalMessageOptions>;
-  };
-
-export class ChatMemoryBuffer<AdditionalMessageOptions extends object = object>
-  implements BaseMemory<AdditionalMessageOptions>
-{
-  tokenLimit: number;
-
-  chatStore: BaseChatStore<AdditionalMessageOptions>;
-  chatStoreKey: string;
-
-  constructor(
-    init?: Partial<ChatMemoryBufferParams<AdditionalMessageOptions>>,
-  ) {
-    this.chatStore =
-      init?.chatStore ?? new SimpleChatStore<AdditionalMessageOptions>();
-    this.chatStoreKey = init?.chatStoreKey ?? "chat_history";
-    if (init?.llm) {
-      const contextWindow = init.llm.metadata.contextWindow;
-      this.tokenLimit =
-        init?.tokenLimit ??
-        Math.ceil(contextWindow * DEFAULT_TOKEN_LIMIT_RATIO);
-    } else {
-      this.tokenLimit = init?.tokenLimit ?? DEFAULT_TOKEN_LIMIT;
-    }
-
-    if (init?.chatHistory) {
-      this.chatStore.setMessages(this.chatStoreKey, init.chatHistory.messages);
-    }
-  }
-
-  get(initialTokenCount: number = 0) {
-    const chatHistory = this.getAll();
-
-    if (initialTokenCount > this.tokenLimit) {
-      throw new Error("Initial token count exceeds token limit");
-    }
-
-    let messageCount = chatHistory.length;
-    let tokenCount =
-      this._tokenCountForMessageCount(messageCount) + initialTokenCount;
-
-    while (tokenCount > this.tokenLimit && messageCount > 1) {
-      messageCount -= 1;
-      if (chatHistory.at(-messageCount)?.role === "assistant") {
-        // we cannot have an assistant message at the start of the chat history
-        // if after removal of the first, we have an assistant message,
-        // we need to remove the assistant message too
-        messageCount -= 1;
-      }
-
-      tokenCount =
-        this._tokenCountForMessageCount(messageCount) + initialTokenCount;
-    }
-
-    // catch one message longer than token limit
-    if (tokenCount > this.tokenLimit || messageCount <= 0) {
-      return [];
-    }
-
-    return chatHistory.slice(-messageCount);
-  }
-
-  getAll() {
-    return this.chatStore.getMessages(this.chatStoreKey);
-  }
-
-  put(message: ChatMessage<AdditionalMessageOptions>) {
-    this.chatStore.addMessage(this.chatStoreKey, message);
-  }
-
-  set(messages: ChatMessage<AdditionalMessageOptions>[]) {
-    this.chatStore.setMessages(this.chatStoreKey, messages);
-  }
-
-  reset() {
-    this.chatStore.deleteMessages(this.chatStoreKey);
-  }
-
-  private _tokenCountForMessageCount(messageCount: number): number {
-    if (messageCount <= 0) {
-      return 0;
-    }
-
-    const chatHistory = this.getAll();
-    const msgStr = chatHistory
-      .slice(-messageCount)
-      .map((m) => m.content)
-      .join(" ");
-    return msgStr.split(" ").length;
-  }
-}
@@ -1,10 +0,0 @@
-import type { ChatMessage } from "@llamaindex/core/llms";
-
-export interface BaseMemory<AdditionalMessageOptions extends object = object> {
-  tokenLimit: number;
-  get(...args: unknown[]): ChatMessage<AdditionalMessageOptions>[];
-  getAll(): ChatMessage<AdditionalMessageOptions>[];
-  put(message: ChatMessage<AdditionalMessageOptions>): void;
-  set(messages: ChatMessage<AdditionalMessageOptions>[]): void;
-  reset(): void;
-}
@@ -1,65 +0,0 @@
-import type { ChatMessage } from "@llamaindex/core/llms";
-import type { BaseChatStore } from "./types.js";
-
-/**
- * fixme: User could carry object references in the messages.
- *  This could lead to memory leaks if the messages are not properly cleaned up.
- */
-export class SimpleChatStore<
-  AdditionalMessageOptions extends object = Record<string, unknown>,
-> implements BaseChatStore<AdditionalMessageOptions>
-{
-  store: { [key: string]: ChatMessage<AdditionalMessageOptions>[] } = {};
-
-  public setMessages(
-    key: string,
-    messages: ChatMessage<AdditionalMessageOptions>[],
-  ) {
-    this.store[key] = messages;
-  }
-
-  public getMessages(key: string): ChatMessage<AdditionalMessageOptions>[] {
-    return this.store[key] || [];
-  }
-
-  public addMessage(
-    key: string,
-    message: ChatMessage<AdditionalMessageOptions>,
-  ) {
-    this.store[key] = this.store[key] || [];
-    this.store[key].push(message);
-  }
-
-  public deleteMessages(key: string) {
-    if (!(key in this.store)) {
-      return null;
-    }
-    const messages = this.store[key]!;
-    delete this.store[key];
-    return messages;
-  }
-
-  public deleteMessage(key: string, idx: number) {
-    if (!(key in this.store)) {
-      return null;
-    }
-    if (idx >= this.store[key]!.length) {
-      return null;
-    }
-    return this.store[key]!.splice(idx, 1)[0]!;
-  }
-
-  public deleteLastMessage(key: string) {
-    if (!(key in this.store)) {
-      return null;
-    }
-
-    const lastMessage = this.store[key]!.pop();
-
-    return lastMessage || null;
-  }
-
-  public getKeys(): string[] {
-    return Object.keys(this.store);
-  }
-}
@@ -1,19 +0,0 @@
-import type { ChatMessage } from "@llamaindex/core/llms";
-
-export interface BaseChatStore<
-  AdditionalMessageOptions extends object = object,
-> {
-  setMessages(
-    key: string,
-    messages: ChatMessage<AdditionalMessageOptions>[],
-  ): void;
-  getMessages(key: string): ChatMessage<AdditionalMessageOptions>[];
-  addMessage(key: string, message: ChatMessage<AdditionalMessageOptions>): void;
-  deleteMessages(key: string): ChatMessage<AdditionalMessageOptions>[] | null;
-  deleteMessage(
-    key: string,
-    idx: number,
-  ): ChatMessage<AdditionalMessageOptions> | null;
-  deleteLastMessage(key: string): ChatMessage<AdditionalMessageOptions> | null;
-  getKeys(): string[];
-}
@@ -1,5 +1,4 @@
-export { SimpleChatStore } from "./chatStore/SimpleChatStore.js";
-export * from "./chatStore/types.js";
+export * from "@llamaindex/core/storage/chat-store";
 export { PostgresDocumentStore } from "./docStore/PostgresDocumentStore.js";
 export { SimpleDocumentStore } from "./docStore/SimpleDocumentStore.js";
 export * from "./docStore/types.js";
@@ -1,5 +1,11 @@
 # @llamaindex/groq

+## 0.0.3
+
+### Patch Changes
+
+- @llamaindex/openai@0.1.4
+
 ## 0.0.2

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/groq",
  "description": "Groq Adapter for LlamaIndex",
-  "version": "0.0.2",
+  "version": "0.0.3",
  "type": "module",
  "main": "./dist/index.cjs",
  "module": "./dist/index.js",
@@ -1,5 +1,12 @@
 # @llamaindex/openai

+## 0.1.4
+
+### Patch Changes
+
+- Updated dependencies [749b43a]
+  - @llamaindex/core@0.2.2
+
 ## 0.1.3

 ### Patch Changes
@@ -1,7 +1,7 @@
 {
  "name": "@llamaindex/openai",
  "description": "OpenAI Adapter for LlamaIndex",
-  "version": "0.1.3",
+  "version": "0.1.4",
  "type": "module",
  "main": "./dist/index.cjs",
  "module": "./dist/index.js",
@@ -352,7 +352,7 @@ importers:
        specifier: ^0.53.0
        version: 0.53.0(typescript@5.6.2)
      '@llamaindex/core':
-        specifier: workspace:^0.2.1
+        specifier: workspace:^0.2.2
        version: link:../core
      '@llamaindex/env':
        specifier: workspace:^0.1.11
Author	SHA1	Message	Date
github-actions[bot]	72440c101f	Release 0.6.2 (#1217 ) Co-authored-by: github-actions[bot] <github-actions[bot]@users.noreply.github.com> Co-authored-by: himself65 <himself65@users.noreply.github.com>	2024-09-16 16:40:33 -07:00
Alex Yang	423d66b07a	refactor: chat memory & chat history into core module (#1201 )	2024-09-16 16:09:17 -07:00
Alex Yang	b42adebd51	fix: get job result in llama parse reader (#1216 )	2024-09-16 16:05:47 -07:00
Alex Yang	749b43a3b1	fix: multi model embedding (#1215 )	2024-09-16 15:51:24 -07:00