📘 步骤1:导入Excel(读取第2列论文标题)
从Excel第2列读取纯论文标题(不含老师名),用于与PDF文件名提取的论文标题比对。
📌 改进的比对逻辑说明:
🔧 特殊字符处理:
• 比对前会自动去除所有特殊字符(保留:字母、数字、中文、空格)
• 英文字母统一转为小写进行比对
• 示例:Metal–Organic → metalorganic
✅ 精确匹配:规范化后完全相同
• Excel: Space Exploration of Metal–Organic Frameworks
• PDF: 邓慧聪-Space Exploration of Metal-Organic Frameworks.pdf
• 结果: 精确匹配
⚠️ 模糊匹配:Excel标题包含在PDF标题中
• Excel: 基于深度学习的算法
• PDF: 王炜-基于深度学习的算法_龚遵国.pdf
• 结果: 模糊匹配(有额外内容)