Quant

協議式回購 (Negotiated Repurchase Agreement): 一種兩方自行協商條款, 私下完成的回購交易模式, 與在交易所或通過競價方式進行的回購 (如公開競價式回購) 相對應. 適合大型機構或有特殊需求的交易對手 (在資金緊張或特定標的難以在公開市場獲得時, 機構傾向採用協議式回購, 以內部信用安排快捷地完成融資或投資操作). 通常仍透過中央交易對手清算機構 (CCP) 或中央結算系統 (如銀行間結算中心) 進行資金與證券的交收, 以降低交收風險.

Frequency:

Purpose:

Stuff To Trade:

比較項目 融資 融券
借的是? 現金 股票
建立的是? 多單 空單
最大虧損 股價歸零(損失本金) 理論無上限(股價無上限)
常見用途 看多槓桿 做空、套利、避險
合約類型 到期時間 優點 缺點 適合策略類型
近月合約 最接近現在的交割月份(例如3月時的3月合約) 🔹 流動性最高
🔹 買賣價差(bid-ask spread)最小
🔹 價格反應市場資訊最即時
🔸 快速接近交割,需頻繁換倉
🔸 可能受交割效應影響(如逼倉、實物交割風險)
🔸 價格波動較劇烈
日內交易、超短週期套利、需高流動性的高頻策略
次月合約 第二接近現在的月份(例如3月時的4月或5月合約) 🔹 波動性較低
🔹 可延後換倉,減少交易成本
🔹 避開交割風險
🔸 流動性略低於近月
🔸 買賣價差稍大
中短期趨勢策略、rollover穩定性策略
遠月合約 超過兩個月以上的合約(例如3月時的6月、9月、12月) 🔹 價格平穩,受交割因素影響小
🔹 更貼近市場對長期預期的定價
🔹 適合期限結構套利(期貨曲面交易)
🔸 流動性差
🔸 買賣價差大
🔸 滿倉容易受到槓桿擴大的不利變化影響
跨期套利、長週期因子策略、期限結構模型(term structure models)

期貨定價公式 (無預期成分的理論模型):

F = S \cdot e^{(r - d) \cdot T}
\begin{align*} F &: \text{期貨價格(Futures Price)} \\ S &: \text{現貨價格(Spot Price)} \\ r &: \text{無風險利率(Risk-free Interest Rate)} \\ d &: \text{持有成本或股息收益率(Dividend Yield / Cost of Carry)} \\ T &: \text{到期期限(Time to Maturity)} \end{align*}

Strategy

Strategy Classification:

中性策略 (多空策略, Long–Short Strategy):

非中性策略:

Strategy base on Alpha/Beta:

中性: Hedge Fund

類型 中性目標 控制方法
市場β中性 不暴露市場方向 β中性對沖
行業中性 不暴露行業分佈 行業內配對、多空對沖
市值中性 不偏重大小盤 按市值調整持倉比重
因子中性 避免暴露某些風格 去偏因子暴露(如動量)

Beta

特性 ETF 傳統指數基金
交易時間 盤中隨時交易 交易日結束後淨值交易
價格形成 市場供需決定,存在溢價折價 按淨值定價
交易成本 佣金 + 買賣差價 申購/贖回費用
管理費 較低 較高
稅務效率 較高 較低
投資門檻 較低 較高

對比: 傳統指數基金面向大衆, 通常額度小, 人工費用高, 運營起來麻煩需要對接客戶. 而 ETF 因爲自動化, 所以人工少, 資金大.

Beta Strategy

三分類 (Three-class Classification): 判斷上漲, 持平或無明顯變動, 下跌.

Bag-of-SFA-Symbols (BOSS): BOSS 是一種用於時間序列數據的表示和分類的技術, 利用 Symbolic Fourier Approximation (SFA) 將時間序列轉化為符號串, 再用bag-of-words方法提取特徵, 最後進行分類.

Alpha

Models

LightGBM: don't use it

XGBoost: don't use any classification

Metrics/Loss:

Gaussian Process, RL Generative Model

Software

Trading Software (Quantitative Modeling Tool, QMT)

TBMC (TradeBlazer): 策略開發, 回測和實盤交易. 圖形化的界面, 用類似 C# 的語言來編寫交易策略.

Winpy: 基於 Python 的量化交易框架, 支持多種數據源和交易接口

訊投QMT

米匡

DPDK (Data Plane Development Kit): DPDK is a set of libraries and drivers designed to accelerate packet processing in user space. It allows applications to bypass the kernel and interact directly with network hardware, reducing overhead and increasing throughput.

RDMA (Remote Direct Memory Access): RDMA is a technology that allows computers to access each other's memory directly over a network without involving the CPU, cache, or operating system. (low-latency financial applications)

Direct Market Access (DMA): 你的程式 → 直接連接券商的 DMA gateway → 交易所 (而非 你的程式 → 券商風控系統 → 券商人機系統 → 交易所), 省掉延遲, 控制訂單精度, 毫秒級或微秒級交易行為.

AlgoPlus

WonderTrader

CTP接口

聚宽的因子看板

traderblocks, 支持Meta5的fxdreema, algobuilderx, 运行在NT8的tradedevi, 运行在NT8: sharkindicators

专门为Quant而设计的: amibroker, Multicharts Net

Factors

Capital Asset Pricing Model (CAPM)

R_i = R_f + \beta_i (R_m - R_f) + \alpha_i + \epsilon_i
\begin{cases} R_i: & \text{資產 } i \text{ 的實際回報率} \\ R_f: & \text{無風險利率 (risk-free rate)} \\ \beta_i: & \text{資產 } i \text{ 的 Beta 值} \\ R_m: & \text{市場組合的回報率} \\ \alpha_i: & \text{資產 } i \text{ 的 Alpha 值(異常回報)} \\ \epsilon_i: & \text{隨機誤差項} \end{cases}

術指標 (technical indicators): 基於歷史價格和成交量等市場數據 - Market Pricing: 二級市場 (如股票交易所) 上, 基於市場買賣雙方的供需關係形成的資產價格 (有區別於 NAV) - Moving Average: 價格平均 - Moving Average Convergence Divergence: 短期和長期移動平均線的差距 - MACD (Moving Average Convergence Divergence): \text{MACD} = \text{EMA}_{\text{short}} - \text{EMA}_{\text{long}} - Param: Short EMA = 12-day, Long EMA = 26-day, Signal line = 9-day EMA of the MACD - \text{Signal Line} = \text{EMA}_{\text{signal}}(\text{MACD}) - MACD crosses above Signal Line -> Bullish (buy signal) - MACD crosses below Signal Line -> Bearish (sell signal) - MACD divergence from price -> Possible trend reversal - It's also often used with other indicators (e.g., RSI, Bollinger Bands) for filtering and signal confirmation. - 波動率 (Volatility): 回報率 (returns) 的標準差. 高波動率提供了足夠大的價格變動空間, 使得規則策略的交易信號更明顯且更容易捕捉大幅利潤. - ATR (Average True Range): 平均真实波幅, 衡量市场波动性的指标 - Relative Strength Index (RSI): 價格變動速度 - RSI 背离 (Relative Strength Index Divergence) - 底背离: 价格创新低但 RSI 未创新低, 可能预示反转向上 - 顶背离: 价格创新高但 RSI 未跟随, 可能预示反转向下 - 趨勢度 (Trend Strength): 衡量資產價格在某段時間內持續朝一個方向變動的強弱. 高趨勢度則保證這些波動有明確方向, 策略可以順勢持倉, 獲得連續盈利. - 移動平均斜率 (Slope of Moving Average) - 平均趨向指標 (Average Directional Index, ADX) - 趨勢持續時間: 計算價格連續上漲或下跌的天數 - 貼水 (Backwardation): 期貨價格 < 現貨價格 (深潛水: 大貼水) - 升水 (Contango): 期貨價格 > 現貨價格 (高升水: 大升水) - 流動性: 高頻大資金提供流動性盈利 (方便大家轉移資產, 但相對的有代價)

預測信號:

基本面數據 (fundamental data): 公司內在價值和經營狀況的各種財務和經濟指標, 公司財報 (revenue, net income) - 股息 (Dividend): 中小型股普遍沒有穩定高股息 - 持有資產的淨值 (Net Asset Value, NAV): 所有資產的總市值減去負債後的淨值 (有區別於 Market Pricing) - 市盈率: Price-to-Earnings Ratio, P/E: 股價除以每股盈餘 - 市淨率: Price-to-Book Ratio, P/B: 股價除以每股淨資產 - 負債率: Debt-to-Equity Ratio

多因子模型 (multi-factor models): 每個因子可以理解為一個解釋回報的變量,可能是價值因子 (Value Factor), 規模因子 (Size Factor), 動量因子 (Momentum Factor) 等.

截面數據 (Cross-sectional data): 同一時間點不同股票, 交易策略, 市場, 同時收集的價格, 收益率等. ML output relative performance of many assets a one specific future time, so we choose which assets to invest.

時間序列數據 (Time series data): 同一個對象, 在不斷變化的時間軸上連續收集的數據. 主要優化 (t-value, null hypothesis) ML output absolute performance relative to historical performance, so we choose whether to invest into one asset.

壓力位: 歷史高點 支撐位: 歷史低點 均線回踩: 整體上漲時短暫的價格停留

factor exposure: 如果一個策略對某因子有較高的暴露, 代表該策略的收益會隨該因子變動而變動. 如果一個策略使市場風險暴露 (beta) 接近零, 那麼此策略收益不隨市場漲跌而大幅變動.

大多數機構流程:

從數據到特徵 (From data to features):
從原始市場數據(價格、成交量、財務報表等)清洗、整理,計算出可用於建模的特徵(features)。
例如,根據價格計算動量指標,從財報數據計算市盈率等。

從特徵到因子 (From features to factors):
根據業界或理論確定哪些特徵有投資價值,將這些特徵組合成「因子」,作為解釋回報的變量。
例如多個財務指標組合成一個「價值因子」。

建立模型 (Model building):
使用統計或簡單機器學習方法(例如線性回歸)對因子與歷史回報關係建模,估計因子權重。

組合優化 (Portfolio Optimization):
根據模型輸出和風險偏好,計算各股票或資產的權重配置,形成投資組合。
這一步通常涉及數學優化(例如均值-方差優化 mean-variance optimization)。

策略驗證 (Strategy Validation):
通過回測(backtesting)、交叉驗證或紙上交易(paper trading)來檢驗策略在歷史數據或模擬環境中的效果,確保策略有效且穩定。

滑價 (Slippage): 資金參與少 -> 流動性差 -> 點差 (Bid-Ask Spread) 較大, 更容易滑價

保證金:

Lavel II Data Example | 價格(賣) | 委賣量 | | 價格(買) | 委買量 | | ----- | --- | - | ----- | --- | | 4988 | 40口 | ← | → | | | 4987 | 35口 | | 4986 | 60口 | | 4986 | 50口 | | 4985 | 45口 | | 4985 | 20口 | | 4984 | 30口 | | 4984 | 10口 | | 4983 | 20口 |

def estimate_slippage(order_size: int, bid_prices: list[float], bid_volumes: list[int]) -> float:
    # 根據委託簿推估下單後的平均成交價
    total_cost = 0.0
    remaining = order_size
    for price, volume in zip(bid_prices, bid_volumes):
        if remaining <= 0:
            break
        fill = min(remaining, volume)
        total_cost += fill * price
        remaining -= fill
    return total_cost / order_size if order_size > 0 else 0.0

PNL (Profit and Loss): PNL_t = (持倉 * 當期價格變動) - 買賣手續費 - 滑價成本

复权: 股票在除权除息 (分红, 送股, 配股) 之后, 价格会出现 "跳空" 现象 (不是因为市场行为, 而是因为公司行为). 如果你直接用原始收盘价 (也叫不复权价格) 画图或做分析, 会误以为价格突然跌了很多, 实际是派息或送股造成的.

Crypto

容量: 能在市场上投入多少资金而不显著影响收益率

Behavior

主力建倉速度慢:

主力測羅:

小資金測羅:

其他觀點:

Managing

Manager Of Managers (MoM): 即管理人中管理人基金, 指 MOM 管理人委托多个投资顾问对资产组合提供投资建议, 且基金资产需要分成多个子账户, 每个子账户均獨立管理. 和 FoF 類似.

Language Model

From: http://bbs.ailabx.com/topic/38/%E8%A7%82%E7%82%B9-%E5%BB%BA%E8%AE%AE%E4%B8%AA%E4%BA%BA%E5%92%8C%E5%B0%8F%E5%9B%A2%E9%98%9F%E4%B8%8D%E8%A6%81%E7%A2%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83

现在的开源LLM只有权重, 没有数据. 你做领域微调的时候, 由于没有配比原始数据, 微调之后的结果, 极有可能比原本的更差.

常见的一个方案就是, 对一些图片, PDF 文件做好 OCR, 转为 Markdown, 不管是 graphRAG 也好, 还是传统的 ES 搜索, 在每次问答前, 将需要的上下文, 塞给 LLM, 拿到的结果就不会太有问题. RAG 自带在线持续学习的特性, 非常适合业务场景. 目前很难让 LLM 的权重随着业务场景的变化而实时更新, 但知识库可以实现这一点.

开源LLM对一些特定领域的效果非常差, 怎么办? 而我自己的体会是, 我自认为的一些特殊的场景, LLM仍然是可以理解的, 真的不能小瞧它们的通用知识. 128K的上下文长度非常关键! 这个可以降低你RAG的门槛, 以及提高LLM对领域知识的掌握.

将最需要脑子的任务交给o1系列模型, 它唯一的缺点就是非常贵.我只说一个概念, 它的输入是128K, 有效输出长度可以高达2K行, 这个可以用来干什么大家自行探索, 有些经验我实在不舍得分享出去, 哈哈. 比较需要脑子的任务, 交给4o, sonnet3.5这一梯队的模型, 价格也比较贵, 但基本上比多数人的脑子都好. 一些通用任务, 可以交给 4o-mini 和 gemini-flash 这样的模型, 尤其是 gemini-1.5-flash-002, 性价比高到爆. 这里对任务的划分, 就需要一个 agent 自动编排框架. 但是, 我目前还没有找到合适的方案, 仍然靠着最基础的 if-else 逻辑, 还没能实现全自动化, 欢迎大家推荐相关的方案!

看过我之前关于如何吃到行业的低垂果子?帖子的朋友应该知道, 我最近一直思考目标选择的问题. 我认为关键因素的突然出现, 会给版本带来一些不一样的变化. 大家的认知如果能够预知一些变化的下一步影响, 那么就可以提前一步, 拿到低垂果实. 而大模型时代, 基础模型能力的每一次提升, 都算是一次版本更新. 距离大厂基座模型团队之外的AI人, 需要先了解现有LLM的性能边界, 敏锐的分辨出现有模型能力和过去方案的差异, 能否给当前的业务带来新的变化, 然后快速解决现有业务的难题. 不要在低收益的赛道上无意义的投入, 错位竞争, 降维打击, 也许更有效.

Table of Content