标签: 数据分析

  • 化学仪器测量结果分析

    化学仪器测量结果分析

    某化学仪器的测量结果拍屏图片:

    一、标准溶液与标准曲线

    本文内容基于下列假设:

    • 假设FA开头的数据为标准溶液中,已知浓度标准物质测量得到的数据
    • 假设文件名中的100UGML对应标准溶液的浓度100 μg/mL,其它名称同理
    • 假设CL开头的数据为待测样本中,未知浓度待测物质测量得到的数据
    • 假设样本中的待测物质与标准溶液中的标准物质为同一物质
    标准溶液名称实际浓度 μg/mL计算量
    FA-100UGML100104471.916
    FA-10UGML1085.137
    FA-20UGML202767.196
    FA-30UGML3030231.897
    FA-40UGML4040832.18
    FA-50UGML5040752.544
    FA-60UGML6060886.268
    FA-70UGML7068763.407
    FA-80UGML8078734.014
    FA-90UGML9086080.317

    1.1 名词解释

    1.1.1 标准溶液

    已知某物质浓度的溶液。该物质通过称重等方法直接确定质量后溶解到溶剂中。或者由已知浓度的高纯度溶液作为母液,按一定比例稀释得到。标准溶液常见用途之一就是计算标准曲线。

    1.1.2 溶液浓度

    物质与溶液的质量体积比。标准溶液的浓度是确定的,直接取的整数,且具有一系列的等差梯度。

    1.1.3 计算量

    计算量(Calculated Amount)仪器测量某溶液后,计算出的含量/浓度。它的单位完全取决于建立标准曲线时,给标准溶液输入的浓度单位是什么,通常是 ng/mL、μg/mL、mg/L 等。

    1.1.4 响应值

    仪器测量某溶液后,输出的直接结果。单位可以是电压、计数值等,也可以不标示,不影响后续计算。如果仪器从没使用标准溶液建立标准曲线,那么输出的计算量仅是响应值的某种直接体现,肯定不是实际的物质浓度。

    1.1.5 标准曲线

    某物质浓度与仪器响应值之间的关系。物理规律是简洁的。关系最常见的是线性,也有一部分是对数,多项式这些就很少了。越复杂的关系越容易过拟合。

    1.1.6 线性拟合方程

    通过最小平方法线性回归算法,代入已知的浓度和已测的响应值,拟合出直线方程的斜率和截距。X为响应值,Y为浓度。

    1.1.7 相关系数

    表示所有代入的数据点偏离直线的程度,上限为1。越接近1,相关性越强,拟合效果越好。

    1.2 标准曲线

    无论仪器的计算量没有经过标准曲线转换,还是已经经过标准曲线把μg/mL转换为ng/mL,不影响以下对仪器测量数据质量的评价。

    1.2.1 采用全部标准溶液数据点计算的标准曲线

    拟合的直线方程:

    y=0.00086x+10.67719y=0.00086x+10.67719

    相关系数:

    R2=0.97757R^2=0.97757

    1.2.2 采用前5点标准溶液数据点计算的标准曲线

    拟合的直线方程:

    y=0.00074x+13.09567y=0.00074x+13.09567

    相关系数:

    R2=0.88009R^2=0.88009

    1.2.3 采用后5点标准溶液数据点计算的标准曲线

    1.2.3.1 线性拟合

    拟合的直线方程:

    y=0.00093x+6.14551y=0.00093x+6.14551

    相关系数:

    R2=0.96719R^2=0.96719

    1.2.3.2 对数拟合

    拟合的对数方程:

    y=75.71033·ln(x)773.23617y=75.71033·ln(x)-773.23617

    相关系数:

    R2=0.98759R^2=0.98759

    1.3 相关性分析

    • 从数据点的分布看相关关系最可能是线性的。全部数据点的R2=0.97757是比较差的。
    • 定量的仪器只有R2只有1个9通常说明基于这个标曲计算的结果很不准确,况且只算低浓度范围的相关系数更低。
    • 从等差的角度看,浓度10 μg/mL到20 μg/mL,响应值变化量有2682.059。浓度20 μg/mL到30 μg/mL,响应值变化量有27464.701。同样+10 μg/mL后者变化量远大于前者。
    • 从等比的角度看,浓度10 μg/mL到20 μg/mL,响应值变化量有2682.059。浓度20 μg/mL到40 μg/mL,响应值变化量有38064.984。同样×2倍浓度后者变化量远大于前者。
    • 浓度50 μg/mL的响应值比浓度40 μg/mL的更低是不合常理的。

    基本可以判断浓度50 μg/mL以下(对应响应值≈41000)的数据测量不可信。

    二、实测样本

    文件名计算量
    CL0757_day1night2259.129
    CL0759_day2morning4327.589
    CL0774_day2nightNF
    CL0774_day2night-2NF
    CL0774_day2night-31533.003

    2.1 样本浓度值

    将上述样本的仪器计算量作为自变量X,代入标准直线方程,计算得到应变量浓度Y:

    y=0.00086x+10.67719y=0.00086x+10.67719
    文件名浓度 μg/mL浓度 ng/mL
    CL0757_day1night12.6200412620.04
    CL0759_day2morning14.3989214398.92
    CL0774_day2night-311.9955711995.57

    2.2 无计算量样本

    五个样品中,有两个的仪器响应值为NF。NF可能为Not Found等英文单词的缩写。由仪器生产厂家自己定义。

    样品无计算量的直接原因包括但不限于:

    • 计算量为物理上不合理的负数
    • 计算量低于背景噪声、检出限
    • 计算量超出仪器量程范围
    • 输出谱类结果的仪器,其计算量依赖于峰形检测,没有检测出符合条件的峰,也就没有计算量

    样品无计算量的根本原因包括但不限于:

    • 样本本身有问题,待测物质浓度含量太高或太低,混合了其它干扰物质等
    • 对样本的前处理有问题,没有使用合适方式处理样品使其满足仪器对样品形态等要求
    • 使用仪器的测量方法配置有问题,量程范围、阈值、滤波、积分等设置不合适
    • 仪器本身的质量问题,本底噪声信号太强、基线漂移太快等

    2.3 实验设计问题

    day1night和day2morning的样本都只有一个计算量,可能是只测量了一次,也可能是只保留了多次重复测量结果中的一个。无法排除偶然性。

    day2night的样本测量了三次,但是前两次都是无效值。第三次即使有数,其准确性也很可疑。

    三、总结

    基于上述假设和分析,该仪器测量的该物质在该样本提供的浓度范围内,定量的结果不可信。