Open-Assistant/model/model_eval at main · CJ99/Open-Assistant

History

Name		Name	Last commit message	Last commit date
parent directory ..
manual		manual
sample_results		sample_results
README.md		README.md
__init__.py		__init__.py
eval_datasets.py		eval_datasets.py
eval_rm.py		eval_rm.py
rejection_sampling.py		rejection_sampling.py
sampling_score.py		sampling_score.py
utils.py		utils.py

README.md

OA Evaluation

Requirements

cd model/
- pip install -e .
cd oasst-data
- pip install -e .

Quick Start

Generate Sampling reports using SFT model
Evaluate Sampling reports using Reward model
Rejection Sampling using Reward Model

Generate sampling reports

Run

python model/model_eval/manual/sampling_report.py --model-name facebook/galactica-125m --config config/default.json --prompts data/en_100_text.jsonl --report report_file.json -n 10 --verbose

Evaluate sampling reports using RM

Run

python model/model_eval/sampling_score.py --model andreaskoepf/oasst-rm-1-pythia-1b --data_path model/model_eval/manual/sampling_reports/2023-03-01_theblackcat102_pythia-12b-deduped-sft_sampling.json

Example Results

 {'beam5': -1.592665433883667, 'greedy': -1.592665433883667, 'k50': -1.592665433883667, 'magic_numbers': -1.592665433883667, 'mean_reward': '-1.5926653'}

Rejection sampling using RM

Run

python model/model_eval/rejection_sampling.py --data_path model/model_eval/manual/sampling_reports/2023-03-01_theblackcat102_pythia-12b-deduped-sft_sampling.json --model andreaskoepf/oasst-rm-1-pythia-1b

Example Results

{
    "rejected_samples": {
        "mean": "-1.9255",
        "min": "-3.12",
        "max": "-0.5"
    },
    "selected_samples": {
        "mean": "-1.0873333333333335",
        "min": "-2.82",
        "max": "0.26"
    }
}

additionally, selected and rejected samples will be saved to seperate files

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

model_eval

model_eval

README.md

OA Evaluation

Requirements

Quick Start

Generate sampling reports

Evaluate sampling reports using RM

Rejection sampling using RM

Files

model_eval

Directory actions

More options

Directory actions

More options

Latest commit

History

model_eval

Folders and files

parent directory

README.md

OA Evaluation

Requirements

Quick Start

Generate sampling reports

Evaluate sampling reports using RM

Rejection sampling using RM