北太平洋远东拟沙丁鱼年龄鉴定方法的构建

时间:2024-03-14 10:44:06 来源:网友投稿

杨超, 韩海斌, 韦波, 张衡*, 商宸, 苏冰,刘思源, 蒋沛雯, 相德龙

(1.中国水产科学研究院东海水产研究所, 农业农村部远洋与极地渔业创新重点实验室,上海 200090;

2.上海海洋大学海洋科学学院,上海 201306;

3.大连海洋大学船舶与工程学院,辽宁 大连 116000;

4.安徽师范大学生态与环境学院,安徽 芜湖 241000)

准确评估鱼类年龄结构是渔业种群生物学研究的基本要求,高准确率的年龄结构组成是研究鱼类生活史、种群增长率和资源评估的基础,直接影响到鱼类资源评估以及管理政策的制订[1]。鉴定鱼类年龄的方法较多,20世纪常用的方法是采用体长频率来鉴定年龄组成[2],近年来较为常用的方法是通过鱼体上硬组织(如耳石、鳞片、脊椎骨等)的轮纹识别鱼类的年龄[3]。在所有硬组织中,鳞片与耳石是较好的鉴定材料[4],鳞片较易获得,但其易脱落性与再生性常会导致评估不准确。丘吉诺娃1956年在《鱼类年龄和生长的研究方法》[5]中首次提出将鱼类耳石作为年龄鉴定的材料之一,根据耳石上的轮纹进行鉴定,到目前为止仍是使用最广泛的方法之一。耳石是由碳酸钙等组成的硬组织,存在于硬骨鱼类内耳的膜迷路内,共3对,即矢耳石(sagittal)、微耳石(lapillus)和星耳石(asteriscus),担当着平衡器官和听觉器官的功能,因矢耳石在3对耳石中最大,易于观察,且信息记录准确,因此通常被用作鱼类年龄鉴定的首选材料[6-11]。

远东拟沙丁鱼(Sardinops sagax)作为一种暖温性小型中上层硬骨鱼类,是世界上渔获量较高的中上层鱼类之一,但在历史上远东拟沙丁鱼经历过数次资源变动期,其资源量极不稳定,历史上产量最低时(20世纪60年代)不足十万t,产量最高时(20世纪80年代)可达数百万t,因此准确利用其年龄结构对其资源量进行评估是合理利用远东拟沙丁鱼渔业资源的关键所在[12-13]。远东拟沙丁鱼的栖息环境有明显的季节性变化,该变化导致其耳石形成速度在一年中分为2个阶段,生长速度较快时耳石由蛋白质基质形成宽阔不透明带,生长速度较慢时耳石由碳酸钙晶体形成狭窄透明带。在不透明带与透明带之间的界面称为轮纹,该轮纹结构常用于远东拟沙丁鱼的年龄鉴定[14]。关于远东拟沙丁鱼的年龄鉴定,目前常用的是通过耳石轮纹法来进行观察,通过2个专业人士的共同鉴定,得出耳石样本年龄,但该方法受人为主观的影响较大,需要鉴定者具有丰富的经验以及大量时间来进行判断,易导致其年龄结构的偏差。此外,该方法常受到耳石上副轮及干扰轮的影响,进而导致评估结果的不准确[15]。

为寻求一种更加客观的方法对年龄进行鉴定,国内外常用生物学参数与年龄的回归关系进行年龄的鉴定[6,16-19]。本文在使用回归关系的基础上增加深度学习的方法来进行远东拟沙丁鱼的年龄鉴定。深度学习是机器学习领域中一个新的方向,其概念源于人工神经网络的研究。深度神经网络(deep neural networks,DNN)是深度学习的基础,目前被广泛应用于人脸识别、卫星遥感等诸多领域[20-21],但是在渔业生物学领域应用较少,主要是因为生物学样本难采集,数据获取难度大,数据量少,从而导致模型很难取得预期效果,本文尝试搭建较新的深度学习模型并利用现有数据进行模拟,以期获取更好的年龄鉴定方法。

1.1 材料采集及测量

渔获物样品采自北太平洋公海的商业捕捞船队作业海域(39°—43°N、147°—153°E),于2020和2021年的4—11月每月经船队在捕获样品中按照叉长从小到大进行随机采样100~200尾并冷冻保存,运回实验室用于生物学指标测定,生物学指标的测量按照《海洋调查规范》[22]规定的标准进行,测量指标包括叉长(fork length,L)(自吻端至尾叉的长度)、体质量(weight,W)、耳石重量(otolish weight,W0),所有样品共计2 664尾,其中948尾样品取耳石,详见表1。

表1 远东拟沙丁鱼叉长、体质量和耳石重量信息Table 1 Information of fork length,weight and otolish weight of Sardinops sagax

使用超声波清洗机清洗耳石表面的粘液和包膜,在60 ℃的烘箱中烘烤24 h,去除表面水分,干燥冷却到常温后,使用电子天平(ZA305AS,上海赞维)对耳石进行称重。清洗、干燥之后的耳石进行包埋处理,将耳石的听沟一面朝下放置于载玻片上,使用UV胶进行包埋,紫外线灯照射固定。将包埋好的样品置于莱卡光学显微镜(DM750,德国莱卡)10倍物镜下,观察耳石轮纹并通过显微镜成像设备拍照。

1.2 耳石处理及数据分析

1.2.1 基于轮纹观察法的年龄判读 按照传统方法处理之后的耳石轮纹结构不明显,难以通过轮纹观察其年龄(图1A);
通过UV胶包埋处理后的耳石,经透射光照射并通过光学显微镜拍照可得到较为清晰的轮纹(图1B)。然而,包埋之后再经手动研磨的耳石表面轮纹结构没有明显变化(图1C)。经过对比,图1B的包埋方法是最为合适的耳石处理方法。

图1 远东拟沙丁鱼耳石Fig. 1 Otolith image of the Sardinops sagax

参考Mcfarlane等[23]的方法,确定远东拟沙丁鱼耳石轮纹鉴定标准:半透明环必需在耳石表面连续出现,如果半透明环与另1个环合并或者未能在整个耳石表面出现,则被视为假环;
最外层的不透明环不算做完整的环状结构,除非在该环之外仍能观察到另1个不透明环。每一个远东拟沙丁鱼耳石都由2人独自研判,分别计数。如果2人计数相同,则认为年龄判读正确,接受该结果;
若2人计数的年轮数不同,则重新进行判读、计数,并对最终结构进行讨论,若达成一致则接受该结果,否则放弃。将通过轮纹观察法最终得出一致的年龄鉴定结果作为耳石年龄标准。

1.2.2 线性拟合公式 分别拟合矢耳石的重量与年龄,鱼体叉长与年龄,鱼体质量与耳石年龄的一元线性回归方程,比较其拟合回归方程的相关系数(R2)。在此基础上增加多元线性拟合并与一元线性拟合相比较,相关系数(R2)最高的为最佳拟合方程。最后使用最佳拟合方程进行年龄鉴定,本文所有数据拟合及相关系数数值分别通过Excel 2016及Origin模拟实现。

1.3 深度学习模型构建

1.3.1 模型构建 结合当前已获得的耳石的质量、鱼体叉长、鱼体质量以及其对应的年龄4组数据,搭建深度神经网络对3组数据进行训练。其中,本文的自建神经网络整体框架如图2所示。

图2 神经网络整体框架Fig. 2 Whole framework of self-built neural network

将沙丁鱼的叉长、体质量以及对应的耳石质量作为训练数据集输入,其中每尾鱼的测量指标作为1组数据,同时将对应的年龄作为验证集,按照训练集80%、验证集20%比例进行训练。全部数据均转化为Tensor数据类型。模型的整体流程为:将原始的3维数据鱼体叉长、鱼体质量与耳石质量通过Linear操作提升到700维;
运用线性激活函数(rectified linear unit,ReLU)方法将部分神经元的输出变为0,使网络具有稀疏性,同时减少参数的相互依存关系,缓解模型过拟合;
调用Linear操作将模型上升到2 048维以使模型的特征更为明显;
加入一个ReLU操作,将模型的维度提高至4 096维,达到特征最为明显的效果;
对模型进行降维操作,将4 096维降至1 024维,使模型的特征进行融合。进行2次Linear操作,将模型降至其7维对应0、1、2、3、4、5、6。最后将所输出的7维结果与验证集相比较,得出模型的最终结果。

式中,y为输出结果;
x为输入参数;
B为权重矩阵;
T为将矩阵转置;
b表示偏置。

式中,t为ReLU函数的输出结果;
max()0,a表示将a<0的数全部转为0,a≥0的则保持不变。

1.3.2 模型评价指标 实际结果与预测结果相符,为真阳性(true positive,NTP);
实际结果与预测结果不符,为假阳性(false positive,NFP);
预测结果与实际结果均不符,为真阴性(true negative,NTN);
预测结果与实际结果不符,为假阴性(false negative,NFN),其表达式如下。

式中,Ppre指将正确预测出来的正样本数量占所有预测出来的样本数量的比率,Prec指将正确预测出的正样本数量和所有的正样本数量的比率。

在深度神经网络模型中,通常采用损失率(Ploss)、平衡F分数(PF1)、准确率和召回率等指标对模型进行评价[25]。

Ploss为真实值与预测值之间的差值,损失值越小表明结果距离真实值越接近,该指标使用交叉熵损失函数,其表达式如下。

式中,P(x)为对应年龄值的取值;
q(x)为相对应概率值。

F1-score是Prec和Ppre的调和值,综合考虑了召回率和精准率对试验数据的影响,避免某一指标来主导试验结果,其表达式如下

本文深度模型搭建及模型效果评价均通过Python 3.7.11实现。

2.1 年龄与耳石质量、体质量、叉长的关系

2.1.1 年龄鉴定比例分析 成对t检验结果分析显示,远东拟沙丁鱼的左、右耳石质量并无明显差异(P>0.05),因此选用左侧矢耳石进行轮纹观察并鉴定年龄。鉴定结果(图3)表明,样本年龄中1+、2+和3+的个体占据50%以上,表明远东拟沙丁鱼种群年轻个体占比较高。

图3 耳石轮纹观察法所得各年龄组成比例Fig. 3 Age composition of otolith ring observation method

2.1.2 生物学数据对应年龄分布箱型图分析 对年龄分布与耳石质量、叉长和体质量的箱形图(图4)的分析结果表明,远东拟沙丁鱼的耳石质量、叉长和体质量在1+~5+的年龄组间均有重叠,5+~6+的年龄组间无重叠。虽然重叠部分较多,但箱形图中耳石质量、鱼体叉长和鱼体质量的均值与中值随着年龄组的增大而表现的增长趋势仍非常明显,表明耳石质量、鱼体叉长和鱼体质量均随着年龄的增大而增长。

图4 远东拟沙丁鱼耳石质量、叉长和体质量对应年龄分布的箱形图Fig. 4 Box diagram of otolith weight , fork length and weight to age distribution of Sardinops sagax

2.2 回归方程拟合及应用

2.2.1 最佳拟合方程 在单变量拟合回归方程中,通过对比各函数关系,得出相关系数(R2)最高的线性拟合关系可以作为年龄与各生物学参数的最佳拟合公式。耳石质量(W0)与年龄(A)、鱼体质量(W)与年龄(A)、叉长(L)与年龄(A)的最佳拟合方程分别如公式(7)~(9)所示。

通过分析一元拟合方程的相关系数,得出耳石质量与鱼类年龄的相关性最高,对比可知,耳石质量与耳石年龄的拟合程度最高,因此将耳石质量所预测的年龄作为一元拟合鉴定年龄。

通过3个变量即耳石质量、叉长与体质量拟合年龄的公式如下。

通过相关系数最高的单变量耳石质量与年龄拟合方程公式如下。

2.2.2 拟合回归方程鉴定年龄验证对比 通过耳石质量与年龄的一元拟合法鉴定年龄和用多个生物学特征的多元拟合法所得出的年龄结构,与轮纹观察法得出的年龄结构相比无显著差异(P=0.956>0.05;P=0.93>0.05)(图5)。

图5 实测轮纹观察法年龄与线性拟合回归鉴定的年龄Fig. 5 Age identified by measured surface observation and linear fitting regression

2.3 模型训练结果分析

如图6所示,模型经过3 000次训练达到稳定结果。随着迭代次数增加到3 000次,该模型识别年龄的精度稳定在0.716;
由召回率与迭代次数的关系图可知,随着迭代次数增加到3 000次,模型识别年龄的召回率接近0.6。图6中的F1值可以表明试验方法的有效性,在训练迭代次数达到3 000次,F1值逐渐稳定在0.61左右。从损失率与迭代次数的关系可知,随着迭代次数的增加,模型的损失率也逐渐降低,直到稳定在1.24以下。

图6 深度学习模型的精度、召回率、损失率和F1值与训练次数迭代图Fig. 6 Iteration diagram of accuracy、recall rate、loss rate、F1 value and training times

2.4 鉴定准确率结果比较分析

将所有鉴定样本输入自建深度学习模型,通过训练所得的鉴定结果与轮纹观察法所得年龄对比无误差的情况下,深度学习模型取得的最大准确率为71.6%(表2)。

表2 3种方法鉴定结果的准确率Table 2 Prediction accuracy results of three methods

使用拟合回归方程鉴定年龄的方法是Boehlert在1985年首次提出[6],利用多个关于耳石的变量即耳石质量、耳石长度等构建回归方程预测年龄。国内使用拟合回归方程鉴定年龄多见于淡水鱼类中耳石质量与年龄的回归关系[16,26]。本文采用的拟合回归方程,分别分析了叉长、体质量和耳石质量与年龄的拟合公式并比较其相关性,通过对比发现,耳石质量与年龄的相关性最高,其R2超过0.80。通过拟合曲线得出的远东拟沙丁鱼年龄结构经分析发现,其与轮纹观察法所得到的年龄结构并无差异,经过对比发现使用多元拟合方程进行年龄鉴定的准确率高于一元拟合方程。使用拟合回归方法最大的优点是简单易得,但是该方法也具有缺陷性:其一是必须对预测数据与现有数据进行乘幂或者使用对数等其他方法进行变换以获取线性关系,这将导致数据的变动从而影响预测结果[27-31];
其二是使用该方法会产生年龄估计比例的渐进偏差,从而导致预测结果产生一定的偏差[7]。因此,本研究尝试使用新方法即通过构建深度学习模型对年龄进行鉴定,以避免使用拟合回归方程所导致的渐进偏差对远东拟沙丁鱼年龄结构所带来的误差影响。

目前,国际上使用机器学习的方法对鱼类年龄进行鉴定的相关研究大多使用耳石图像[32-33]。在较为常用的经典算法中,Seam比较了贝叶斯(Naïve Bayes,NB)、决策树(J48)与随机森林(random forest, RF)在鱼类年龄鉴定方面的应用,分别表述了各个模型的特点。NB算法为通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类;
但使用该模型要求建立在数据准确性较高的基础上。J48算法为从上到下递归的分治策略,选择某个属性放置在根节点,为每个可能的属性值产生1个分支,将实例分成多个子集,每个子集对应1个根节点的分支,然后在每个分支上递归地重复这个过程,该模型要求不同类之间的数量差别要尽可能地大。RF是由个别树输出的类别的众数而定,即根数特征数量的多少进行分类。在样本组成不均衡的情况下会导致误分为其他类。Benzer等[34]通过人工神经网络(artificial neural network,ANN)与传统回归方法分别对莫干湖的北梭子鱼(Esox lucius)进行年龄预测,从结果比较来看ANN方法可以成为线性回归模型的较好的替代方法。

深度学习方法可以根据多个因素进行鱼类年龄的自动判别,鱼类叉长、体质量以及耳石质量等生物学数据都可以对鱼类年龄进行判读[35-36]。本研究采用的深度神经网络(Linear-Rule)与数据匹配度更高,具有更高的准确率,采用softmax进行维度变化,让不同年龄之间生物学数据特征更加明显。为评估模型的分类性能,本文模型使用4个指标对模型效果进行评估,都达到了较好的结果。由于该技术基于可测量的参数,因此在数据处理的适应性、年龄的标准化等方面更具优势。此外,通过比较拟合回归方程与深度学习的预测准确性可知,该模型的准确率要远高于线性拟合方法。

从检测结果来看,深度学习训练的各项指标都较好,但从鉴定准确率来看,虽然深度学习模型所鉴定的结果均高于线性拟合回归方程,但其鉴定的准确率还未达到最佳效果,在之后的工作中应当增加数据量用来训练模型以提高模型预测的准确率,从而更好的帮助研究者进行远东拟沙丁鱼年龄鉴定工作。

猜你喜欢沙丁鱼耳石远东远东正大检验集团有限公司纺织检测与标准(2022年6期)2022-03-07沙丁鱼雪豆月读·高年级(2021年9期)2021-09-262020远东无损检测新技术论坛顺利召开无损检测(2020年12期)2020-12-26耳石症患者后管复位治疗成功后头晕症状临床观察中华养生保健(2020年7期)2020-11-16最后一条沙丁鱼文学少年(原创儿童文学)(2019年1期)2019-05-23轻视的代价神州·下旬刊(2018年10期)2018-11-10你了解耳石症吗老友(2018年7期)2018-08-08从燕麦片到沙丁鱼,这7种食物能让你更健康中国化妆品(2018年6期)2018-07-09耳朵生病也会眩晕科学生活(2017年9期)2017-10-16远东战役中的和平天使连环画报(2015年8期)2015-12-04

推荐访问:远东 沙丁鱼 鉴定