前沿观察,

专利检索与分析系列之一:做大分子药物FTO时如何选择序列数据库?

中国 | 中文
所在网站 :    中国   |   中文
澳大利亚
中国香港特别行政区
新加坡
美国
全球

在刚刚过去的2021年,生物医药企业大量上市,截至2021年11月1日,生物医药企业占科创板已经受理申请公司总数的20.25%(652家中的132席)[1]。而在港股18A方面,到2021年12月31日为止,共有48家生物科技公司已发行,23家生物科技企业已递表[2]。在科创板受理的132家生物医药企业中,有五分之一的企业属于生物制品领域,而71家18A生物科技企业中生物制药企业有47家,占了绝大多数。

无论是科创板首先关注的科创属性,还是港交所18A政策所强调的“核心产品”的研究和开发,都意味着投资者最关心的问题是生物医药公司核心产品的先进程度,以及知识产权是否存在瑕疵。因此,贯穿生物大分子药物投融资的专利侵权风险排查(FTO),无论是针对蛋白还是核酸药物,作为整个IP尽职调查的重要且核心内容,必须更加缜密和细致。

工欲善其事,必先利其器。目前可用作大分子序列FTO检索分析的主流数据库有三个:STN Biosequences,GenomeQuest(GQ)和Patsnap Bio。其中,STN是美国化学文摘社(CAS)的老牌数据库,历史悠久,用户基数大,数据范围不仅包括CAS自己的数据(CAS REGISTRY),而且加入了德温特的数据(DERWENT GENESEQ)。新晋后辈GQ是一个专注大分子序列的美国数据库,对比STN,GQ收录了更多的专利和非专利文献中的序列信息。而智慧芽公司的Patsnap Bio,在不断完善数据收录量的同时,在满足中国本土需求方面做得相对比较好。三个商业数据库都对序列检索算法不断迭代优化,同时努力扩宽对专利和非专利文献的收录范围,三者的使用费用均相当高昂,例如GQ,单条序列检索的价格为850美元。既然鼠标轻轻一点,850美元就花出去了,那么我们在序列检索之前,首先要慎重考虑的问题就是检索策略和数据库的选择。

这些昂贵的数据库,会不会遗漏高风险专利?

我们以一个常见的抗体序列检索为例(参见图1),三个数据库都支持对抗体CDR分别进行检索的策略。

图1:抗体轻重链可变区全长序列示例

不论是STN和Patsnap沿袭自NCBI的Blast算法,或者GQ独特的GenePAST算法,在简单的抗体CDR检索上并不会有显著的差别。对于检索结果影响比较大的,反而是三个数据库不同的结果显示和导出方式(参见表1)。

表1:数据库检索结果显示和导出方式比较

表1中所谓的“以专利归并”,就是指相同的一段序列,如果出现在多个专利中,则会被合并成一条结果进行显示和导出,比如在图1的例子中,我们检索到一条目标序列,能同时匹配轻链的三个CDR(L1、L2和L3),而这条序列出现在748篇专利中,那么根据STN和Patsnap的规则,将只作为一条结果输出,而按照GQ的规则,会被作为3X748=2244个结果输出。

因此,虽然GQ有高达一百万的结果显示容量,由于输出规则的制约,很可能出现的情况是,某些短CDR匹配到的序列数量超出一百万条。例如在下图2所示的情况中,由于重链CDR1只有五个氨基酸,匹配到的序列数量超出了规则的上限。

黄任重,《科创板生物医药企业上市案例的实证分析研究》,金杜研究院,2021.11.26

沙利文捷利(深圳)云科技有限公司,《港股18A生物科技公司发行投资活报告》,2022,.2.4

图2:短CDR匹配的目标序列数量超过上限的情况

在抗体FTO检索中,高风险专利的选取标准首选三个CDR全部匹配的情况。再看本文的例子,GQ识别到的高风险序列有211条(参见图3)。

图3:GQ检索结果的并集处理

很明显,由于CDR1结果不完整,实质上导致这个FTO检索最后识别出来的211条高风险序列并不是穷尽的,如果以此作为尽调报告的分析基础,则显然是存在根本性问题的。反观STN和Patsnap,由于将序列进行归并,检索结果超出上限的情况就会比较少。

读到这里,大家可能有点晕,会问:那么在工作中任选STN和Patsnap其一是不是就可以了呢?

答案是“不一定”!我们还是来看本文示例的抗体检索的结果,在下图4中可以看到,STN和Patsnap的结果并不完全一致,在轻链的检索结果中,两个数据库都识别出的高风险专利数为454篇,两者各丢失了一定数量的高风险专利,重链检索的结果亦然。

图4:STN和Patsnap检索结果比较

通过逐一比对专利,我们发现,Patsnap对中国专利的收录及文本加工做得比较好,有些中国专利即使在STN的收录范围之内,但是由于STN对序列文本识别的问题,无法被算法找到。对比Patsnap,STN对国外专利的收录以及文本加工更胜一筹。

由此可见,要做一份缜密的大分子序列的检索报告,特别是当其中的侵权风险排查工作需要涵盖中美欧等主要市场的时候,仅仅使用一种数据库,无论检索策略如何周全,受制于数据库的先天缺陷,总是会百密一疏。因此需要同时使用两个数据库做交叉覆盖检索。当然,如果预算充足,用三个主流数据库叠加检索,会更有保障。

专利检索与分析是很多专利工作的基础,本文比较了做大分子药物FTO使用的主流数据库,后续我们将逐一介绍不同数据库、不同领域的检索策略,以及检索分析的不同应用实例,敬请期待。

参考资料

  • [1]

    黄任重,《科创板生物医药企业上市案例的实证分析研究》,金杜研究院,2021.11.26

  • [2]

    沙利文捷利(深圳)云科技有限公司,《港股18A生物科技公司发行投资活报告》,2022,.2.4

最新文章
前沿观察
2024年12月31日,中国国家知识产权局发布了《人工智能相关发明专利申请指引(试行)》(下称“《指引》”),意在进一步明确和细化我国现行专利法律制度框架下人工智能领域的专利审查政策,回应创新主体普遍关切的热点法律问题。基于此,本文针对人工智能是否能成为发明专利的适格客体这一问题进行了探讨,并进一步对中美两国对于人工智能专利客体的适格性标准进行了比较研究,以期为出海企业在全球范围内的专利布局提供参考。知识产权-专利,人工智能

2025/01/15

前沿观察
2024年,我国经济以“稳中求进”为总基调,以“攻坚克难”为关键词, 新“国九条”和资本市场“1+N”政策落地见效。从“坚持把防控风险作为金融工作永恒主题”的战略方向, 到《关于加强监管防范风险推动资本市场高质量发展的若干意见》等资本市场风险防控工作的具体落实;从“金融监管要‘长牙带刺’、有棱有角”的深刻把握,到“零容忍”打击各类违法违规行为的从严监管;从“上市公司是市场之基,是投资价值的源泉” 这一正确认识,到出台上市公司市值管理指引、深化上市公司并购重组市场改革等一系列规范政策出台。 2024年,是引导和督促上市公司完善公司治理,建设建强以投资者为本的资本市场的重要一年。上市公司是国民经济的“基本盘”、“压舱石”和“优等生”,是经济高质量发展的重要微观基础。 上市退市方面,严把发行上市准入关,从源头上提高上市公司质量,严格强制退市标准,拓宽多元化退出渠道,2024年全年55家上市公司平稳退市 ;外资投资方面,发挥战略投资渠道引资潜力,支持长期投资、价值投资;股份减持方面,有效防范绕道减持,细化违规责任条款;市值管理方面,引导上市公司关注自身投资价值,切实提升投资价值;并购重组方面,深化上市公司并购重组市场改革,支持经济转型升级、实现高质量发展;强化监管方面,加强信息披露监管,严惩业绩造假,加强现金分红监管,增强投资者回报。在对上市公司的全链条监管下,我国着力打造安全、规范、透明、开放、有活力、有韧性的资本市场。 2024年,是全面实施“强本强基、严监严管”的关键一年。“金融的安全靠制度、活力在市场、秩序靠法治。”2024年全年,证监会办理各类案件739件,罚没款金额超过上一年的两倍。推动形成财务造假综合惩防体系,严肃查处欺诈发行、财务造假、违规减持、操纵市场等一批大要案 ;持续打击实控人等“关键少数”违法,助力维护中小投资者合法权益;强化行政、刑事、民事立体化追责,助力提高违法成本。突出“严”,立足“效”,着眼“准”,聚力“合”,以强有力行政执法工作护航资本市场高质量发展,不断增强投资者的获得感和投资安全感。 2024年,是资本市场波澜诡谲、上市公司犯罪查处愈发从严的一年。根据我们的不完全统计,本年度A股上市公司及关联主体涉嫌刑事犯罪或遭受刑事侵害的案件共有102起,涉及97家上市公司。 纵览上市公司刑事犯罪情况,财产与金融安全仍是高风险领域,操纵证券市场、违规内幕交易愈发成为上市公司犯罪重灾区。从执法趋势来看,司法机关针对上市公司犯罪案件,施行刑事追责、市场禁入、行政处罚、民事赔偿等多元手段,不仅打击直接的犯罪行为,还同步审查非法配资、“黑嘴”荐股、出具虚假审计报告、洗钱等上下游、前后手犯罪,致力维护资本市场秩序、保护中小投资者利益。 通过梳理及分析2024年度上市公司犯罪情况,我们形成本年度上市公司犯罪报告,继续揭示上市公司刑事风险的趋势与特点,以期从一般社会预防的角度,为上市公司及相关方增强刑事调查与合规意识、预防刑事法律风险提供帮助。争议解决与诉讼-刑事调查及辩护,证券与资本市场-上市公司常年法律顾问,金融机构-金融市场监管

2025/01/14

前沿观察
排污许可制是针对固定污染源环境监管的核心制度,也是环境监管制度的重大改革内容之一。2016年国务院印发《控制污染物排放许可制实施方案》,开始推行排污许可制度改革,原环境保护部先后印发《排污许可管理办法》(试行)和《排污许可管理办法》,从部门规章层面为推进排污许可制度提供了规章依据。2021年国务院制定《排污许可管理条例》,排污许可制度上升到“行政法规”层面,这一法规的出台,标志着排污许可制度改革取得了阶段性成果。 近年来,党中央、国务院对深化排污许可制度改革提出了新要求,党的二十大报告要求全面实行排污许可制,《中共中央 国务院关于全面推进美丽中国建设的意见》再次提出全面实行排污许可制要求,党的二十届三中全会通过的《中共中央关于进一步全面深化改革 推进中国式现代化的决定》,明确“落实以排污许可制为核心的固定污染源监管制度”的改革目标任务。在此背景下,2024年11月生态环境部发布了《全面实行排污许可制实施方案》(下称“《实施方案》”),这是落实党中央国务院部署,深化排污许可制度改革的一项重要举措。 根据《实施方案》提出的重点任务,深化排污许可制度改革的重点将聚焦进一步完善排污许可相关法律法规及标准技术规范体系等、落实以排污许可制为核心的固定污染源监管制度、全面落实固定污染源“一证式”管理、进一步加强排污许可基础保障建设等。深化排污许可制度改革提出的重点任务也包括对排污单位提出要求,即排污单位需构建基于排污许可证的环境管理制度。 本文拟结合我们长期为排污单位提供环境法律服务的经验,针对目前排污单位排污许可管理的状况、存在的问题及不足,就如何构建基于排污许可证的环境管理制度谈谈我们的看法,以供参考。合规业务-环境法

2025/01/13