PKU-Alignment
/

ProgressGym-HistLlama3-8B-C017-instruct-v0.2

@@ -1,50 +1,28 @@
-{"current_steps": 1, "total_steps": 192, "loss": 0.9877, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0, "epoch": 0.020833333333333332, "percentage": 0.52, "elapsed_time": "0:00:02", "remaining_time": "0:09:25"}
-{"current_steps": 5, "total_steps": 192, "loss": 0.9606, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.5e-06, "epoch": 0.10416666666666667, "percentage": 2.6, "elapsed_time": "0:00:08", "remaining_time": "0:05:11"}
-{"current_steps": 10, "total_steps": 192, "loss": 0.9201, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.25e-06, "epoch": 0.20833333333333334, "percentage": 5.21, "elapsed_time": "0:00:15", "remaining_time": "0:04:35"}
-{"current_steps": 15, "total_steps": 192, "loss": 0.8431, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 9e-06, "epoch": 0.3125, "percentage": 7.81, "elapsed_time": "0:00:22", "remaining_time": "0:04:24"}
-{"current_steps": 20, "total_steps": 192, "loss": 0.8222, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.275e-05, "epoch": 0.4166666666666667, "percentage": 10.42, "elapsed_time": "0:00:30", "remaining_time": "0:04:22"}
-{"current_steps": 20, "total_steps": 192, "loss": null, "eval_loss": 0.8593380451202393, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.4166666666666667, "percentage": 10.42, "elapsed_time": "0:00:30", "remaining_time": "0:04:22"}
-{"current_steps": 25, "total_steps": 192, "loss": 0.8289, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.3195176200175283e-05, "epoch": 0.5208333333333334, "percentage": 13.02, "elapsed_time": "0:01:27", "remaining_time": "0:09:46"}
-{"current_steps": 30, "total_steps": 192, "loss": 0.8983, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 9.515676612044427e-06, "epoch": 0.625, "percentage": 15.62, "elapsed_time": "0:01:34", "remaining_time": "0:08:30"}
-{"current_steps": 35, "total_steps": 192, "loss": 0.8188, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 6.797580677308734e-06, "epoch": 0.7291666666666666, "percentage": 18.23, "elapsed_time": "0:01:40", "remaining_time": "0:07:32"}
-{"current_steps": 40, "total_steps": 192, "loss": 0.8014, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.808575415542887e-06, "epoch": 0.8333333333333334, "percentage": 20.83, "elapsed_time": "0:01:47", "remaining_time": "0:06:47"}
-{"current_steps": 40, "total_steps": 192, "loss": null, "eval_loss": 0.8517706990242004, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.8333333333333334, "percentage": 20.83, "elapsed_time": "0:01:47", "remaining_time": "0:06:47"}
-{"current_steps": 45, "total_steps": 192, "loss": 0.8782, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.3676619069852654e-06, "epoch": 0.9375, "percentage": 23.44, "elapsed_time": "0:03:27", "remaining_time": "0:11:17"}
-{"current_steps": 50, "total_steps": 192, "loss": 0.7259, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.334947896124909e-06, "epoch": 1.0416666666666667, "percentage": 26.04, "elapsed_time": "0:03:34", "remaining_time": "0:10:08"}
-{"current_steps": 55, "total_steps": 192, "loss": 0.4621, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.603233215095547e-06, "epoch": 1.1458333333333333, "percentage": 28.65, "elapsed_time": "0:03:40", "remaining_time": "0:09:09"}
-{"current_steps": 60, "total_steps": 192, "loss": 0.4422, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.0911174606561334e-06, "epoch": 1.25, "percentage": 31.25, "elapsed_time": "0:03:47", "remaining_time": "0:08:19"}
-{"current_steps": 60, "total_steps": 192, "loss": null, "eval_loss": 0.8722255825996399, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 1.25, "percentage": 31.25, "elapsed_time": "0:03:47", "remaining_time": "0:08:19"}
-{"current_steps": 65, "total_steps": 192, "loss": 0.4117, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 7.373930741131784e-07, "epoch": 1.3541666666666667, "percentage": 33.85, "elapsed_time": "0:05:24", "remaining_time": "0:10:33"}
-{"current_steps": 70, "total_steps": 192, "loss": 0.4422, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.965174334325768e-07, "epoch": 1.4583333333333333, "percentage": 36.46, "elapsed_time": "0:05:31", "remaining_time": "0:09:36"}
-{"current_steps": 75, "total_steps": 192, "loss": 0.4432, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.349849877937343e-07, "epoch": 1.5625, "percentage": 39.06, "elapsed_time": "0:05:37", "remaining_time": "0:08:47"}
-{"current_steps": 80, "total_steps": 192, "loss": 0.4551, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.2844505627726646e-07, "epoch": 1.6666666666666665, "percentage": 41.67, "elapsed_time": "0:05:44", "remaining_time": "0:08:01"}
-{"current_steps": 80, "total_steps": 192, "loss": null, "eval_loss": 0.8555447459220886, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 1.6666666666666665, "percentage": 41.67, "elapsed_time": "0:05:44", "remaining_time": "0:08:01"}
-{"current_steps": 85, "total_steps": 192, "loss": 0.4222, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.594328760942437e-07, "epoch": 1.7708333333333335, "percentage": 44.27, "elapsed_time": "0:07:20", "remaining_time": "0:09:14"}
-{"current_steps": 90, "total_steps": 192, "loss": 0.4309, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.156010161291434e-07, "epoch": 1.875, "percentage": 46.88, "elapsed_time": "0:07:27", "remaining_time": "0:08:26"}
-{"current_steps": 95, "total_steps": 192, "loss": 0.4793, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 8.835555547373544e-08, "epoch": 1.9791666666666665, "percentage": 49.48, "elapsed_time": "0:07:35", "remaining_time": "0:07:45"}
-{"current_steps": 100, "total_steps": 192, "loss": 0.3806, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 7.181664349277562e-08, "epoch": 2.0833333333333335, "percentage": 52.08, "elapsed_time": "0:07:44", "remaining_time": "0:07:06"}
-{"current_steps": 100, "total_steps": 192, "loss": null, "eval_loss": 0.8529651165008545, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 2.0833333333333335, "percentage": 52.08, "elapsed_time": "0:07:44", "remaining_time": "0:07:06"}
-{"current_steps": 105, "total_steps": 192, "loss": 0.3745, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 6.203637972657601e-08, "epoch": 2.1875, "percentage": 54.69, "elapsed_time": "0:09:24", "remaining_time": "0:07:47"}
-{"current_steps": 110, "total_steps": 192, "loss": 0.409, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.6418543066491835e-08, "epoch": 2.2916666666666665, "percentage": 57.29, "elapsed_time": "0:09:30", "remaining_time": "0:07:05"}
-{"current_steps": 115, "total_steps": 192, "loss": 0.3605, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.329471712759216e-08, "epoch": 2.3958333333333335, "percentage": 59.9, "elapsed_time": "0:09:37", "remaining_time": "0:06:26"}
-{"current_steps": 120, "total_steps": 192, "loss": 0.4011, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.161995210302015e-08, "epoch": 2.5, "percentage": 62.5, "elapsed_time": "0:09:43", "remaining_time": "0:05:50"}
-{"current_steps": 120, "total_steps": 192, "loss": null, "eval_loss": 0.8576686978340149, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 2.5, "percentage": 62.5, "elapsed_time": "0:09:43", "remaining_time": "0:05:50"}
-{"current_steps": 125, "total_steps": 192, "loss": 0.3872, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.075841465580837e-08, "epoch": 2.6041666666666665, "percentage": 65.1, "elapsed_time": "0:11:21", "remaining_time": "0:06:05"}
-{"current_steps": 130, "total_steps": 192, "loss": 0.3853, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.033564114946932e-08, "epoch": 2.7083333333333335, "percentage": 67.71, "elapsed_time": "0:11:28", "remaining_time": "0:05:28"}
-{"current_steps": 135, "total_steps": 192, "loss": 0.3832, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.013915282607116e-08, "epoch": 2.8125, "percentage": 70.31, "elapsed_time": "0:11:34", "remaining_time": "0:04:53"}
-{"current_steps": 140, "total_steps": 192, "loss": 0.37, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.005343402153039e-08, "epoch": 2.9166666666666665, "percentage": 72.92, "elapsed_time": "0:11:41", "remaining_time": "0:04:20"}
-{"current_steps": 140, "total_steps": 192, "loss": null, "eval_loss": 0.8621854782104492, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 2.9166666666666665, "percentage": 72.92, "elapsed_time": "0:11:41", "remaining_time": "0:04:20"}
-{"current_steps": 145, "total_steps": 192, "loss": 0.3799, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.001872829857116e-08, "epoch": 3.0208333333333335, "percentage": 75.52, "elapsed_time": "0:13:17", "remaining_time": "0:04:18"}
-{"current_steps": 150, "total_steps": 192, "loss": 0.3821, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.000587713853837e-08, "epoch": 3.125, "percentage": 78.12, "elapsed_time": "0:13:25", "remaining_time": "0:03:45"}
-{"current_steps": 155, "total_steps": 192, "loss": 0.3799, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.0001608748597456e-08, "epoch": 3.2291666666666665, "percentage": 80.73, "elapsed_time": "0:13:33", "remaining_time": "0:03:14"}
-{"current_steps": 160, "total_steps": 192, "loss": 0.3626, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.0000370319656156e-08, "epoch": 3.3333333333333335, "percentage": 83.33, "elapsed_time": "0:13:39", "remaining_time": "0:02:43"}
-{"current_steps": 160, "total_steps": 192, "loss": null, "eval_loss": 0.8658773303031921, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 3.3333333333333335, "percentage": 83.33, "elapsed_time": "0:13:39", "remaining_time": "0:02:43"}
-{"current_steps": 165, "total_steps": 192, "loss": 0.3646, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.0000067945715855e-08, "epoch": 3.4375, "percentage": 85.94, "elapsed_time": "0:15:13", "remaining_time": "0:02:29"}
-{"current_steps": 170, "total_steps": 192, "loss": 0.347, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.0000009144677036e-08, "epoch": 3.5416666666666665, "percentage": 88.54, "elapsed_time": "0:15:20", "remaining_time": "0:01:59"}
-{"current_steps": 175, "total_steps": 192, "loss": 0.3734, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.0000000785521776e-08, "epoch": 3.6458333333333335, "percentage": 91.15, "elapsed_time": "0:15:26", "remaining_time": "0:01:30"}
-{"current_steps": 180, "total_steps": 192, "loss": 0.3708, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.000000003317662e-08, "epoch": 3.75, "percentage": 93.75, "elapsed_time": "0:15:33", "remaining_time": "0:01:02"}
-{"current_steps": 180, "total_steps": 192, "loss": null, "eval_loss": 0.8686714768409729, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 3.75, "percentage": 93.75, "elapsed_time": "0:15:33", "remaining_time": "0:01:02"}
-{"current_steps": 185, "total_steps": 192, "loss": 0.3746, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.000000000038355e-08, "epoch": 3.8541666666666665, "percentage": 96.35, "elapsed_time": "0:17:08", "remaining_time": "0:00:38"}
-{"current_steps": 190, "total_steps": 192, "loss": 0.3734, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.000000000000018e-08, "epoch": 3.9583333333333335, "percentage": 98.96, "elapsed_time": "0:17:15", "remaining_time": "0:00:10"}
-{"current_steps": 192, "total_steps": 192, "loss": null, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 4.0, "percentage": 100.0, "elapsed_time": "0:17:18", "remaining_time": "0:00:00"}
-{"current_steps": 3, "total_steps": 3, "loss": null, "eval_loss": 0.8517706990242004, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 4.0, "percentage": 100.0, "elapsed_time": "0:17:51", "remaining_time": "0:00:00"}

+{"current_steps": 1, "total_steps": 48, "loss": 1.0256, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0, "epoch": 0.020833333333333332, "percentage": 2.08, "elapsed_time": "0:00:06", "remaining_time": "0:04:55"}
+{"current_steps": 3, "total_steps": 48, "loss": 0.9401, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 7.5e-07, "epoch": 0.0625, "percentage": 6.25, "elapsed_time": "0:00:07", "remaining_time": "0:01:58"}
+{"current_steps": 5, "total_steps": 48, "loss": null, "eval_loss": 1.0273184776306152, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.10416666666666667, "percentage": 10.42, "elapsed_time": "0:00:09", "remaining_time": "0:01:19"}
+{"current_steps": 6, "total_steps": 48, "loss": 1.0723, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.25e-06, "epoch": 0.125, "percentage": 12.5, "elapsed_time": "0:00:10", "remaining_time": "0:01:16"}
+{"current_steps": 9, "total_steps": 48, "loss": 0.8986, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.865909090909091e-06, "epoch": 0.1875, "percentage": 18.75, "elapsed_time": "0:00:13", "remaining_time": "0:00:56"}
+{"current_steps": 10, "total_steps": 48, "loss": null, "eval_loss": 0.8249552249908447, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.20833333333333334, "percentage": 20.83, "elapsed_time": "0:00:13", "remaining_time": "0:00:51"}
+{"current_steps": 12, "total_steps": 48, "loss": 0.7947, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.6647727272727274e-06, "epoch": 0.25, "percentage": 25.0, "elapsed_time": "0:01:02", "remaining_time": "0:03:08"}
+{"current_steps": 15, "total_steps": 48, "loss": 0.8471, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.4636363636363635e-06, "epoch": 0.3125, "percentage": 31.25, "elapsed_time": "0:01:05", "remaining_time": "0:02:23"}
+{"current_steps": 15, "total_steps": 48, "loss": null, "eval_loss": 0.8088635802268982, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.3125, "percentage": 31.25, "elapsed_time": "0:01:05", "remaining_time": "0:02:23"}
+{"current_steps": 18, "total_steps": 48, "loss": 0.7753, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.2625e-06, "epoch": 0.375, "percentage": 37.5, "elapsed_time": "0:01:08", "remaining_time": "0:01:53"}
+{"current_steps": 20, "total_steps": 48, "loss": null, "eval_loss": 0.7956812977790833, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.4166666666666667, "percentage": 41.67, "elapsed_time": "0:01:10", "remaining_time": "0:01:38"}
+{"current_steps": 21, "total_steps": 48, "loss": 0.8096, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.0613636363636364e-06, "epoch": 0.4375, "percentage": 43.75, "elapsed_time": "0:01:59", "remaining_time": "0:02:33"}
+{"current_steps": 24, "total_steps": 48, "loss": 0.7273, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.8602272727272725e-06, "epoch": 0.5, "percentage": 50.0, "elapsed_time": "0:02:00", "remaining_time": "0:02:00"}
+{"current_steps": 25, "total_steps": 48, "loss": null, "eval_loss": 0.7896435856819153, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.5208333333333334, "percentage": 52.08, "elapsed_time": "0:02:01", "remaining_time": "0:01:51"}
+{"current_steps": 27, "total_steps": 48, "loss": 0.7979, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.659090909090909e-06, "epoch": 0.5625, "percentage": 56.25, "elapsed_time": "0:02:03", "remaining_time": "0:01:36"}
+{"current_steps": 30, "total_steps": 48, "loss": 0.8296, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.4579545454545454e-06, "epoch": 0.625, "percentage": 62.5, "elapsed_time": "0:02:05", "remaining_time": "0:01:15"}
+{"current_steps": 30, "total_steps": 48, "loss": null, "eval_loss": 0.7850656509399414, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.625, "percentage": 62.5, "elapsed_time": "0:02:05", "remaining_time": "0:01:15"}
+{"current_steps": 33, "total_steps": 48, "loss": 0.6945, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.2568181818181817e-06, "epoch": 0.6875, "percentage": 68.75, "elapsed_time": "0:02:59", "remaining_time": "0:01:21"}
+{"current_steps": 35, "total_steps": 48, "loss": null, "eval_loss": 0.7812349796295166, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.7291666666666666, "percentage": 72.92, "elapsed_time": "0:03:00", "remaining_time": "0:01:06"}
+{"current_steps": 36, "total_steps": 48, "loss": 0.7577, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.0556818181818182e-06, "epoch": 0.75, "percentage": 75.0, "elapsed_time": "0:03:01", "remaining_time": "0:01:00"}
+{"current_steps": 39, "total_steps": 48, "loss": 0.7112, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 8.545454545454544e-07, "epoch": 0.8125, "percentage": 81.25, "elapsed_time": "0:03:03", "remaining_time": "0:00:42"}
+{"current_steps": 40, "total_steps": 48, "loss": null, "eval_loss": 0.7789459824562073, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.8333333333333334, "percentage": 83.33, "elapsed_time": "0:03:04", "remaining_time": "0:00:36"}
+{"current_steps": 42, "total_steps": 48, "loss": 0.7853, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 6.534090909090911e-07, "epoch": 0.875, "percentage": 87.5, "elapsed_time": "0:03:55", "remaining_time": "0:00:33"}
+{"current_steps": 45, "total_steps": 48, "loss": 0.821, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.522727272727273e-07, "epoch": 0.9375, "percentage": 93.75, "elapsed_time": "0:03:57", "remaining_time": "0:00:15"}
+{"current_steps": 45, "total_steps": 48, "loss": null, "eval_loss": 0.7771243453025818, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 0.9375, "percentage": 93.75, "elapsed_time": "0:03:57", "remaining_time": "0:00:15"}
+{"current_steps": 48, "total_steps": 48, "loss": 0.8119, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.511363636363638e-07, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:04:00", "remaining_time": "0:00:00"}
+{"current_steps": 48, "total_steps": 48, "loss": null, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:04:00", "remaining_time": "0:00:00"}
+{"current_steps": 3, "total_steps": 3, "loss": null, "eval_loss": 0.7789459824562073, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:04:38", "remaining_time": "0:00:00"}