New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Llm large reference #1915

Open

pgmpablo157321 wants to merge 10 commits into master from llm_large_reference

Contributor

pgmpablo157321 commented Nov 12, 2024

No description provided.

github-actions bot commented Nov 12, 2024 •

edited

Loading

MLCommons CLA bot All contributors have signed the MLCommons CLA ✍️ ✅

pgmpablo157321 force-pushed the llm_large_reference branch 2 times, most recently from 3b33ce1 to 7be9b13 Compare

November 14, 2024 23:43

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/Dockerfile Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/Dockerfile Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/README.md Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/README.md Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/README.md Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/consolidate_results.py

+                  no_eos_ids = []
+                  for qid, output in tqdm(run_outputs.items()):
+                      L = list(output)
+                      # Prune trailing 2s (EOS token)

Contributor

nvzhihanj Nov 15, 2024

EOS ID is not 2 for llama-405B. Need to use tokenizer.eos_token_id.

Contributor

nvzhihanj Nov 15, 2024

Same thing below

Contributor Author

pgmpablo157321 Nov 22, 2024

What is the purpose of consolidate_results.py? I copied it from Llama2 but don't know why it is needed

Contributor

nvzhihanj Nov 22, 2024

Might not be needed since we don't split pickle anymore. Please remove if not needed.

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/consolidate_results.py

+                      predictions=preds, references=targets, use_stemmer=True, use_aggregator=False
+                  )
+                  assert len(rouge_scores["rouge1"]) == 24576

Contributor

nvzhihanj Nov 15, 2024

TODO

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/dataset.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/dataset.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/dataset.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/dataset.py Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/run_accuracy.sh Outdated Show resolved Hide resolved

nvzhihanj reviewed

View reviewed changes

language/llama3-405b/user.conf Show resolved Hide resolved

v-shobhit reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py Outdated Show resolved Hide resolved

v-shobhit reviewed

View reviewed changes

language/llama3-405b/SUT_VLLM.py

Comment on lines +158 to +161

+                      self.model = LLM(
+                          self.model_path,
+                          dtype=self.dtype,
+                          tensor_parallel_size=self.tensor_parallel_size,

Contributor

v-shobhit Nov 15, 2024

Is there a reason we are not using AsyncLLMEngine here? It may be more efficient since it will support continous batching

v-shobhit reviewed

View reviewed changes

language/llama3-405b/consolidate_results.py

+              def main(args):
+                  # Set up decode and evaluation objects
+                  tokenizer = LlamaTokenizerFast.from_pretrained(args.model_dir)

Contributor

v-shobhit Nov 18, 2024

i may be wrong, but would it better to use AutoTokenizer here?

Contributor

nvzhihanj Nov 22, 2024

I also suggest to use AutoTokenizer for robustness

pgmpablo157321 force-pushed the llm_large_reference branch 2 times, most recently from 5da4409 to e44c62a Compare

November 22, 2024 21:07

pgmpablo157321 added 2 commits

November 22, 2024 16:08


          Initial codebase llama3-405b reference implementation

8f90f5a


          Add VLLM backend

1f85798

pgmpablo157321 added 4 commits

November 22, 2024 16:08


          Prune llama2 files & Update commands

724b98b


          Update evaluate accuracy script


          Fix minor issues

b8864d6


          Add Llama3 configuration

fe9c189

pgmpablo157321 force-pushed the llm_large_reference branch from 3fbdbb0 to fe9c189 Compare

November 22, 2024 21:08


          Merge fe9c189 into 35c7e1f

pgmpablo157321 marked this pull request as ready for review

November 22, 2024 21:08

pgmpablo157321 requested a review from a team as a code owner

November 22, 2024 21:08

pgmpablo157321 and others added 3 commits

November 22, 2024 21:09


          [Automated Commit] Format Codebase

8eab195


          Set tensor_parallel_size to 8

6ba97f9


          Add requirements.txt

cafe4b0

pgmpablo157321 changed the title ~~[WIP] Llm large reference~~ Llm large reference

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet