报错解决_Segmentation fault
引言效果展示过程结论最后重装了 scipy 解决了。
引用
记录一次 Pytorch 使用中遇到 Segmentation fault (core dumped) 的经历 - 知乎
机器学习自动化调参
引言效果展示过程autoML[2]安装[3]
12conda install gxx_linux-64 gcc_linux-64 swigconda install auto-sklearn
结论引用
tpot
AutoML: Ensemble!自動化集成學習戰力大評比 — — AutoKeras vs. Auto-Sklearn vs. TPOT vs. FLAML | by Alan Wang | Medium
Installation — AutoSklearn 0.15.0 documentation
机器学习 xgboost 参数价值和调整方法
引言知其然而不知其所以然的态度做学问迟早要吃大亏的,不如说是前期工作做的越多越好,后期就会越爽越轻松。机器学习方面,虽然大家都是调参小子,但是随便调只为了拟合测试集肯定是不对的,所以我认为好好看看每个参数代表什么是很有必要的。这次主要看的是 xgboost 的参数详情,来自官网[1].
参数详情部分翻译来源于[2], 详细说明参照官网[3].
通用参数booster [默认=gbtree]描述:选择要使用的提升器类型,可以是 gbtree(树模型)、gblinear(线性模型)或 dart(Dropouts meet Multiple Additive Regression Trees)。
device [默认=cpu]描述:XGBoost 运行的设备选择,可设置为以下值:cpu: 使用 CPU。cuda: 使用 GPU(CUDA 设备)。cuda:: 是指定要使用的 GPU 的序数(如果有多个设备)。gpu: 默认 GPU 设备选择,从可用且受支持的设备列表中选择。目前只支持 cuda 设备。gpu:: 默认 GPU 设备选择,从可用且受支持的设备列表中选择。目 ...
机器学习输入数据应该如何标准化
引言效果展示过程选用指引机器学习数据标准化的六种方法[1]
123456789if data == 'Non-Normal Distribution': try power_transformelif data contains outliers: try robust_scaleelse: try minmax_scaleif data == 'Normal Distribution': try scale, normalize
判断是否满足正态分布的方法[2,3,4,5]
是否归一化在机器学习中,基因表达量通常使用测序数据的读取计数或归一化读取计数作为值。这些值可以通过 RNA 测序(RNA-seq)获得,这是一种使用高通量测序技术来识别和定量转录 RNA 的方法。然后,这些读取计数可以进一步归一化以消除实验偏差和技术偏差。
例如,常见的归一化方法包括 TPM(每百万转录本)和 FPKM(每千基因每百万映射)或 RPKM(每千基因每百万映射)。这些方法考虑了基因长度和测序深度的影响,使得不同样本之间的基因表达量可以 ...
去除批次效应输入什么值
引言首先,这个我怀疑不是 log 数据,而是 tpm, tpm 加一起是 1 百万,所以单个一般就是几,十几二,ComBat 的输入要求是经过归一化操作的表达量数据,归一化的方法可以是 array 等包处理的,也可以用 ComBat-Seq 处理 raw count三,在 sva 包的 sva for sequencing (svaseq) 一节中,作者说In our original work we used the identify function for data measured on an approximately symmetric and continuous scale. For sequencing data, which are often represented as counts, a more suitable model may involve the use of a moderated log function(在我们最初的工作中,我们对在近似对称和连续尺度上测量的数据使用了识别函数。对于通常表示为计数的测序数据,更合适的模型可能涉及使用调节的对数函 ...
新假面骑士
影评其实我挺喜欢的…我已经决定多看几季了…
原来看 amazon 的时候感觉还是太子贡向了就没继续看,但是随着年龄的增长,我..好像能喜欢一些更子贡的东西了…
说起 amazon, 仁叔瞎眼变身那真的好帅啊,真的帅爆炸了。反正我可以为了这一段去看一季的。
Amazon!! 第二季仁叔最后一次变身《假面骑士 Amazons》_哔哩哔哩_bilibili
引用
自动中英修正工具 - AutoCorrect
引言
一个 VSCode 插件,基于 Rust 编写的工具,用于「自动纠正」或「检查并建议」文案,给 CJK(中文、日语、韩语)与英文混写的场景,补充正确的空格,纠正单词,同时尝试以安全的方式自动纠正标点符号等等。类似 ESlint、Rubocop、Gofmt 等工具,AutoCorrect 可以用于 CI 环境,它提供 Lint 功能,能便捷的检测出项目中有问题的文案,起到统一规范的作用。支持各种类型源代码文件,能自动识别文件名,并准确找到字符串、注释做自动纠正。AutoCorrect 的愿景是提供一套标准化的文案较正方案。以便于在各类场景(例如:撰写书籍、文档、内容发布、项目源代码…)里面应用,让使用者轻松实现标准化、专业化的文案输出 / 校正。
同样是纠正,我觉得 AutoCorrect [1]比 cSpell 好多了,虽然还没有探究字典功能,但是开箱即用真的很爽。而且能自动纠正标点符号特别好,特别好啊!! 不过经过我的实验,好像!是不纠正的。
可以下载各端的应用程序[2]以对各种文档格式化,但我更喜欢 VSCode 插件[3]的方式。
效果展示
过程在工作区禁用某 ...
使用 RSSHub 订阅目标信息
引言效果展示过程Trending articles
Support Sci-Hub
Author: @y9c @nczitzk
Example: https://rsshub.app/pubmed/trending
Route: /pubmed/trending/:filter?
Parameters:
filter, optional - Filters, can be found in URLTIPFor the parameter filter, the filter parameter in the URL should be split into a string by ,, here is an example.
In https://pubmed.ncbi.nlm.nih.gov/trending/?filter=simsearch1.fha&filter=pubt.clinicaltrial&filter=pubt.randomizedcontrolledtrial, the filter parameters are s ...
VS Code 括号、引号的自动补全
引言效果展示过程1/Applications/Microsoft/Visual Studio Code.app/Contents/Resources/app/extensions/markdown-basics/language-configuration.json
结论引用
VScode使用remote-ssh实现服务器上绘图可视化
引言有时候在服务器上绘图会受到结果不显示的困扰,无论是R还是python都会有类似的情况,那么有什么比较方便的应用呢?
本文的前提是你使用VScode并以安装好python等环境,可以日常在服务器工作。
使用的方案是X协议,详细介绍见[4]. 具体使用软件是MacOS的Quartz或Windows的Xming, Linux的xauth, VScode的插件remote X11和remote X11(ssh).
效果展示
过程可视化方案大概需要三个步骤:
安装本地X端 (X client)
安装服务器X端 (X Server)
安装和配置VScode插件
安装本地X端 (X client)MacOSMacOS用的应用是Quartz, 可以直接从官网[5]下载,也可以从brew下载。
一般情况都推荐brew, 但是我Ventura 13.0.1 (22A400) 系统的Apple M1不可用,所以尽量建议官网下载安装包,安装之后记得重启一下。
1brew install xquartz
WindowsWindows用的应用是Xming[6], 具体应用和配置见[1,2,3].
安装服 ...