分类: 技术

14 篇文章

发酵工程-发酵种子
概念发酵工程菌 特点: 培养基原料廉价生长条件易于控制,生长迅速,产量高,酶活高是单产高的营养缺陷型突变菌株或调节突变菌株或野生菌株,最好还是抗噬菌体能力强的菌株菌种纯粹,不易变异退化,以保证稳定性菌种不是病原菌,不产生任何有害的生物活性物质和毒素(包括 抗生素、激素、毒素等),以保证安全 发展趋势: 野生菌→诱发基因突变的变异菌→代谢控制育种→基…
发酵工程-绪论
绪论 发酵工程的相关概念 发酵是什么 传统概念:发酵(fermentation)最初来自于拉丁语“发泡”(fervere),是指酵母作用于果汁或发芽谷物产生$CO_2$的现象。生化和生理学意义:微生物在无氧条件下分解代谢有机物质释放能量的过程。或者更严格地说,发酵是以有机物作为电子受体的氧化还原产能反应。现代概念:利用微生物在有氧或无氧条件下的生命…
二叉树的三种遍历方式
今日做题是意外地碰到了二叉树的三种遍历方式,就写一下吧 前序遍历 def dfs(root): if not root: return # 执行操作 dfs(root.left) dfs(root.right) 中序遍历 def dfs(root): if not root: return dfs(root.left) # 执行操作 dfs(roo…
使用Sklearn来做TF-IDF
昨天是讲了Sklearn的安装以及如何作TF-IDF,今天就来写一下,如何使用Sklearn做TF-IDF。 一般我们使用框架,一定要看的文档一定是官方文档,在文档中寻找是否有相关算法的使用方法。巧了,官方文档中正好有TF-IDF的使用方法。 那么我们就以官方文档的注解,来做今天的TF-IDF。 首先是框架的引入。根据文档,可以使用如下命令引入。 …
Sklearn的安装
在我们开始使用Python的时候,就注定了,我们解决问题的道路会伴随着Python的应用而变得十分便捷。 Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。 Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。 学习TF…
NLP入门之TF-IDF
什么是TF-IDF呢?TF-IDF的全称为Term Frequency–Inverse Document Frequency,为一种用于信息检索与数据挖掘的常用加权技术,常用语挖掘文章中的关键词,算法简单高效。 TF即为“词频”,即Term Frequency,IDF即为“你文档频率”,即Inverse Document Frequency。 想象…
关于Tensorflow在Anaconda中的安装
首先是Anaconda或是Miniconda的安装。 在Windows上,打开“开始”菜单,然后打开Anaconda命令提示符。在macOS或Linux上,打开一个终端窗口。在macOS或Linux上使用默认的bash shell。 为您的TensorFlow环境选择一个名称,例如“ tf”。 要安装当前版本的仅CPU的TensorFlow,建议初…
Building a Spam Classifier
Prioritizing What To Work On 系统设计案例: 给定电子邮件数据集,我们可以为每个电子邮件构造一个向量。此向量中的每个条目代表一个单词。 向量通常包含10,000至50,000个条目,这些条目是通过在我们的数据集中找到最常用的单词而收集的。 如果要在电子邮件中找到一个单词,则将其相应的条目分配为1,否则,将为该条目分配0。…
Learning Curves
学习曲线 在极少数数据点(例如1、2或3)上进行算法训练很容易会发生0错误的现象,因为我们总能找到一条恰好触及这些点数的二次曲线。 因此: 当数据集增大的时候,二次函数的错误也会增多 误差值将在达到一个确定的值m或者一定的训练集大小后趋于平稳。 出现高偏差的情况: 小训练集:会导致$J_{train}(\Theta)$过小或是$J_{CV}(\Th…
Regularization and Bias/Variance
正则化和偏差/方差 在上图中,我们可以清晰地看到,当$\lambda$增加的时候,拟合函数会变得十分僵硬,即我们所谓的拟合效果十分不好。从另一方面来说,当$\lambda$趋近于0的时候,拟合就会变成过拟合。所以,我们应该如何选择我们的参数$\lambda$来使得它不大也不小呢?为了选择合适的模型和正则化参数$\lambda$,我们需要: 初始化一…