annoed_file = '/_LPR/open_dataset/dataset_LPR_keye_merge_20220411122937_refine+20220401151133_refine+0513_refine/M221028_LPR_keye_man_draw_20220513_1528_t_e_4986_554.csv'
# 最新的,使用模型标注过的文件的目录,+++ 一个图片有四个文件,见最上说明
raw_img_and_labelme_dir = '/_LPR/keye_lpr_eval_20221107082943'
csv_raw = pd.read_csv(annoed_file)
# 取出所有已经标注的图片的名字
annoed_imgs = [i.split('.')[0] for i in csv_raw['ImageID'].tolist()]
eval_files = glob(os.path.join(raw_img_and_labelme_dir, '*'))
# 取出所有eval出的图片的名字
eval_ids = [os.path.basename(i).split('.')[0] for i in glob(os.path.join(raw_img_and_labelme_dir, '*.json'))]
# 新的模型标注图片去除已经标注过的图片,得出一个新的列表
dest_ids = [i for i in eval_ids if i not in annoed_imgs]
# 以N张图片为组,建立不同的夹,后面人工标注每一个文件夹
dest_dir_size = 2000
ds = datetime.now().strftime("%Y%m%d")
for ii, sub_list in enumerate(np.array_split(dest_ids, dest_dir_size)):
# 创建文件夹
p = pathlib.Path("meta_car_%s_%s" % (ds, ii))
p.mkdir(exist_ok=True)
for e in tqdm(sub_list):
# 移动4个文件
target_files = [f for f in eval_files if e in f]
shutil.copy(e, p)
※ 修改:·leaf918 于 Nov 8 11:21:48 2022 修改本文·[FROM: 36.110.197.*]
※ 来源:·水木社区
http://www.mysmth.net·[FROM: 36.110.197.*]
修改:leaf918 FROM 36.110.197.*
FROM 36.110.197.*