Yezi's Hexo Blog

Created2025-06-07|bioinformatics

引言美国癌症医学影像档案中心 (The Cancer Imaging Archive, TCIA) 可以下载癌症病例数据，对于 mac 和 win 来说下载软件使用就可以了，但是在连接 linux 的 terminal 可能会出现两个报错：一个是zsh: command not found: nbia-data-retriever, 另一个是java.awt.HeadlessException: No X11 DISPLAY variable was set。第一个意味着系统无法在它查找可执行文件的标准路径（即 $PATH 环境变量指定的目录）中找到名为 nbia-data-retriever 的可执行文件。第二个表明 nbia-data-retriever 这个程序（它是一个 Java 应用程序）试图执行一个需要图形界面（GUI）的操作，但在您当前运行的环境中没有找到可用的显示设备（X11 DISPLAY）。简单来说，这个程序可能在启动时尝试弹出一个窗口（比如用户协议、进度条或配置界面），但您正在一个没有图形界面的终端会话中运行它（这在服务器上很常见）。 12345678910 ...

当 SRA 不能 dump 出来有效数据，如何使用 Amazon S3 下载原始数据 (Use Cloud Data Delivery)

Created2025-05-29|bioinformatics

引言做上游做多了，总有从 sra 数据 dump 不出来需要的东西的情况，有时候是缺一端的匹配数据，有时候是上传的 bam, 有时候是少 l1 文件，总之总有奇奇怪怪的理由不能用 sra, 这时候就需要使用 Amazon S3 下载原始数据。 Amazon S3 是一个对象存储服务，提供了高可用性和可扩展性，适合存储和检索大量数据。对于生物信息学领域，S3 是 NCBI 指定的数据交付手段。缺点：要钱。但第一年免费。过程注册帐号https://portal.aws.amazon.com/billing/signup#/start/email 注册一个 AWS 帐号，注意需要绑定信用卡。创建 S3 存储桶地区我选的 us-east-1. 登录 AWS 管理控制台。在服务列表中选择 S3。点击“创建存储桶”。输入存储桶名称（必须唯一）和区域。配置存储桶设置（如版本控制、加密等）。点击“创建存储桶”。 Use Cloud Data Delivery[3]在Deliver Data页面点击Choose data to deliver in Run Selector按钮选取数据 ...

使用自己的大模型 api 在表格中生成

Created2025-05-21|LLM

引言多维表格大家都听说过吧？比起传统的在线表格这玩意有这样几个优势：本质上是一个在线数据库，所以数据很多很多的时候也不卡可以切换多种视图支持有限的自动化对于大众来说，其实不会太在意背后的技术和用不到的功能，所以可能很多人没有实际体验过，甚至对这玩意需要先规定列的属性相当不适应。自动化功能和精细权限管理太难，多视图模式和数据展示用不上，所以何必折腾呢？我的意见是：他真的有 ai 加成… 其实表格天然就很适合做生成，比起平常文档形式的”上下”视图，表格的”左右”视图可以直观的看到输入的信息和输出的信息。而序号、标题确保了可以快速定位。目前有 ai 加成的多维表格首先是飞书和钉钉，还有 Vika 和 Airtable 等等，我平常就用的钉钉，但是他有个问题：他是免费的。免费当然很好，但是当你薅了大几千次 qwen 之后，他会不断的给你显示”等待中”。那么，花钱行不行呢？问题来了，他是免费的…想花钱也没地方花… 因此，对我来说，重新整一个本地版的 ai 表格就情有可原了，反正技术原理也不复杂。本项目用来解决下面几个痛点：在线表格无法选择 api 供应商在线表格可能会触发大 ...

MacOS 禁用更新

Created2025-04-20|TechMacOS

引言在第 n 次被更新坑了之后，决定禁用更新。关于被坑的经历，大概有这样，比如：为了安全，禁止使用商店内应用使用 cmd 作为快捷键。而且没给选项让我可以不安全的用。但社区版可以。为了安全，把屏幕录制权限调到一天，甚至几分钟一次提示。而且没给选项让我可以不安全的用。但是改 plist 文件可以延长。总之在他悠久的”你好用户我是你爹”的思路下，我还是决定禁用更新得了。禁用更新123456789101112## 禁用软件更新服务sudo defaults write /Library/Preferences/com.apple.SoftwareUpdate AutomaticCheckEnabled -bool false## 禁用更新通知sudo defaults write /Library/Preferences/com.apple.systempreferences AttentionPrefBundleIDs 0sudo defaults write /Library/Preferences/com.apple.systempreferences DidShowPref ...

企业级高性能多维表格 teable

Created2025-04-13

引言为什么选择 TeableTeable 独创的可持续性架构，让企业数据增长不再受制于软件的瓶颈，通过极低的操作门槛加速企业数字化渗透率。每个团队可以按需构建可扩展的业务系统，让应用跟得上业务变化，更能适应业务增长。 Teable 不仅是一个无代码解决方案，更是助力先进的企业数字化得力工具，确保每个团队都能获得适合自己需求的平台。Teable 致力于帮助企业实现数字化转型，让每个团队都能轻松构建和管理自己的业务系统，从而更好地适应企业的发展和变化。效果展示过程创建 docker-compose 文件进入服务器，创建并进入 teable 文件夹 123mkdir teablecd teable 创建一个 docker-compose.yaml 以及一个 .env 文件，并粘贴下面内容，已使用国内镜像源以保证顺畅安装 1vim docker-compose.yaml 当使用自己的数据库时, 可以使用最精简版: 1234567891011121314151617181920212223242526272829303132version: "3.9"services: ...

No title

Created2025-04-05

我相信大家都有一种感觉，就是随着年龄的增大，时间仿佛在越来越快。小时候课间十分钟可以去操场跑一个来回顺便去趟小卖部，但是现在快 30 岁的我 20 分钟只够喝杯水，上个厕所。于是，我尝试着计算我的一分钟等价于多少事，一分钟我可以游 10m, 可以走 m, 可以跑 m, 可以敲 72 个汉字或个 139 英文字符。所以我

服务器加装硬盘备份迁移

Created2025-04-04|TechLinux

引言这篇文章可以帮助系统管理员或需要进行服务器数据迁移的用户。下面是一个使用 restic 进行服务器数据备份的文章大纲和核心内容：过程备份在旧服务器上，使用 restic 进行数据备份。 12345678910111213141516171819ssh-copy-id user@10.9.65.32 # 复制公钥到新服务器以便免密登录## 安装 resticsudo apt install resticexport RESTIC_REPOSITORY=sftp:tenney@10.9.65.32:/path/to/borg/restic/repoexport RESTIC_PASSWORD="1919" # 或者使用密码文件/环境变量export RESTIC_CACHE_DIR=/dev/sda1/path/to/cache ## 如默认备份目录不够用可指定备份目录restic init -r $RESTIC_REPOSITORY --cache-dir=$RESTIC_CACHE_DIR## 备份sudo restic -r $RESTIC_REPOSI ...

mediaanalysisd 占据大类空间的原因和解决方案

Created2025-04-04|TechMacOS

引言不少 Mac 用户在使用过程中可能会发现一个名为 mediaanalysisd 的进程占用了大量的磁盘空间，有时甚至达到几十 GB 或更多，这不免引起担忧：这个进程是什么？为什么它会吞噬宝贵的存储空间？有没有办法解决？作者在反复删除半年后终于下定决心研究一下这个问题…但是得出结论是没啥办法，最好的办法就是给他足够的时间和空间让他工作完成。如果他耽误了别的工作，就只能手动删除完事，但是鉴于他会不断重新工作建议等他工作完… 删除代码： 1rm -rf ~/Library/Containers/com.apple.mediaanalysisd/Data/Library/Caches/com.apple.mediaanalysisd/ mediaanalysisd什么是 mediaanalysisd？mediaanalysisd 是 macOS 和 iOS 系统中的一个后台服务进程。它的主要职责是分析你设备上的媒体文件，尤其是照片图库（Photos Library）和视频文件。这项分析工作包括：人脸识别与分组：扫描照片和视频，识别其中的人脸，并将同一个人归类到“人物”相册中。 ...

Node 转录组数据库批量下载指南

Created2025-03-24|生物信息学

随着转录组研究的深入，研究人员需要从转录组数据库中获取大量的 RNA 测序数据以支持基因表达、选择性剪接等分析。除了我们常用的 GEO（基因表达总库）和 ArrayExpress 数据库，还有一些数据库可以获得 RNA 测序数据比如 Node 转录组数据库 (National Omics Data Encyclopedia, 国家组学数据百科全书：多组学大数据共享平台，Node 数据库)。在本文中，我们将详细介绍 Node 转录组数据库的特点及其批量下载方法，帮助您高效获取所需数据。本文用到的软件均可以使用 conda 直接下载安装。一、Node 转录组数据库简介Node 数据库是一个多组学数据平台，它为研究人员提供了一个集中的数据存储和访问接口，主要包括这些数据类型： DNA 数据：如全基因组测序（WGS）、外显子组测序（WES）、靶向测序等。 RNA 数据：如 RNA-Seq 数据（转录组测序）、单细胞 RNA-Seq、非编码 RNA 等。其他数据：蛋白质组、代谢组、表观遗传学数据等。下面是官网介绍： NODE 是一个生物大数据收集平台，包括实验样本信息的收集、序列文 ...

使用 browser-use-webui 进行网页信息填写和录入

Created2025-03-11|LLM

引言在数字化时代，网页信息填写和录入是许多业务流程中的重要环节，例如注册账户、提交在线表单或更新个人信息。这些任务往往耗时且容易出错，而自动化工具的引入可以显著提高效率并减少人为失误。GitHub 上的 browser-use/web-ui 项目为这一需求提供了一个创新且实用的解决方案。事实上，browser-use 已经提供了一个通用的浏览器自动化工具，但 browser-use/web-ui 更进一步，提供了一个基于 Gradio 构建的 Web 用户界面，并支持多种大型语言模型（LLM），包括 Google、OpenAI、Azure OpenAI、Anthropic、DeepSeek 和 Ollama 等。它允许用户在浏览器中运行 AI 代理，自动完成网页交互任务。该工具的独特功能包括支持自定义浏览器（无需重复登录网站）、高清屏幕录制以及持久化浏览器会话，非常适合需要高效处理网页任务的用户。本文将详细介绍如何通过本地安装（使用 pip）和 Docker 安装两种方式使用 browser-use/web-ui，并提供完整的操作流程。效果展示使用过 ...