普通视图

发现新文章,点击刷新页面。
今天 — 2026年4月5日首页

每日一题-机器人能否返回原点🟢

2026年4月5日 00:00

在二维平面上,有一个机器人从原点 (0, 0) 开始。给出它的移动顺序,判断这个机器人在完成移动后是否在 (0, 0) 处结束

移动顺序由字符串 moves 表示。字符 move[i] 表示其第 i 次移动。机器人的有效动作有 R(右),L(左),U(上)和 D(下)。

如果机器人在完成所有动作后返回原点,则返回 true。否则,返回 false

注意:机器人“面朝”的方向无关紧要。 “R” 将始终使机器人向右移动一次,“L” 将始终向左移动等。此外,假设每次移动机器人的移动幅度相同。

 

示例 1:

输入: moves = "UD"
输出: true
解释:机器人向上移动一次,然后向下移动一次。所有动作都具有相同的幅度,因此它最终回到它开始的原点。因此,我们返回 true。

示例 2:

输入: moves = "LL"
输出: false
解释:机器人向左移动两次。它最终位于原点的左侧,距原点有两次 “移动” 的距离。我们返回 false,因为它在移动结束时没有返回原点。

 

提示:

  • 1 <= moves.length <= 2 * 104
  • moves 只包含字符 'U''D''L' 和 'R'

简单题,简单做(Python/Java/C++/C/Go/JS/Rust)

作者 endlesscheng
2026年3月24日 09:43

机器人的横坐标,等于向右移动的次数,减去向左移动的次数。如果 $\texttt{R}$ 的个数等于 $\texttt{L}$ 的个数,那么最终横坐标为 $0$。

机器人的纵坐标,等于向上移动的次数,减去向下移动的次数。如果 $\texttt{U}$ 的个数等于 $\texttt{D}$ 的个数,那么最终纵坐标为 $0$。

这两个条件同时成立,才能回到原点。

###py

class Solution:
    def judgeCircle(self, moves: str) -> bool:
        return moves.count('R') == moves.count('L') and \
               moves.count('U') == moves.count('D')

###py

class Solution:
    def judgeCircle(self, moves: str) -> bool:
        cnt = Counter(moves)
        return cnt['R'] == cnt['L'] and cnt['U'] == cnt['D']

###java

class Solution {
    public boolean judgeCircle(String moves) {
        int x = 0;
        int y = 0;
        for (char move : moves.toCharArray()) {
            if (move == 'R') {
                x++;
            } else if (move == 'L') {
                x--;
            } else if (move == 'U') {
                y++;
            } else {
                y--;
            }
        }
        return x == 0 && y == 0;
    }
}

###cpp

class Solution {
public:
    bool judgeCircle(string moves) {
        return ranges::count(moves, 'R') == ranges::count(moves, 'L') &&
               ranges::count(moves, 'U') == ranges::count(moves, 'D');
    }
};

###c

bool judgeCircle(char* moves) {
    int x = 0, y = 0;
    for (int i = 0; moves[i]; i++) {
        char move = moves[i];
        if (move == 'R') {
            x++;
        } else if (move == 'L') {
            x--;
        } else if (move == 'U') {
            y++;
        } else {
            y--;
        }
    }
    return x == 0 && y == 0;
}

###go

func judgeCircle(moves string) bool {
    return strings.Count(moves, "R") == strings.Count(moves, "L") &&
           strings.Count(moves, "U") == strings.Count(moves, "D")
}

###js

var judgeCircle = function(moves) {
    const cnt = _.countBy(moves);
    return cnt['R'] === cnt['L'] && cnt['U'] === cnt['D'];
};

###rust

impl Solution {
    pub fn judge_circle(moves: String) -> bool {
        moves.matches('R').count() == moves.matches('L').count() &&
        moves.matches('U').count() == moves.matches('D').count()
    }
}

复杂度分析

  • 时间复杂度:$\mathcal{O}(n)$,其中 $n$ 是 $\textit{moves}$ 的长度。
  • 空间复杂度:$\mathcal{O}(1)$。

分类题单

如何科学刷题?

  1. 滑动窗口与双指针(定长/不定长/单序列/双序列/三指针/分组循环)
  2. 二分算法(二分答案/最小化最大值/最大化最小值/第K小)
  3. 单调栈(基础/矩形面积/贡献法/最小字典序)
  4. 网格图(DFS/BFS/综合应用)
  5. 位运算(基础/性质/拆位/试填/恒等式/思维)
  6. 图论算法(DFS/BFS/拓扑排序/基环树/最短路/最小生成树/网络流)
  7. 动态规划(入门/背包/划分/状态机/区间/状压/数位/数据结构优化/树形/博弈/概率期望)
  8. 常用数据结构(前缀和/差分/栈/队列/堆/字典树/并查集/树状数组/线段树)
  9. 数学算法(数论/组合/概率期望/博弈/计算几何/随机算法)
  10. 贪心与思维(基本贪心策略/反悔/区间/字典序/数学/思维/脑筋急转弯/构造)
  11. 链表、树与回溯(前后指针/快慢指针/DFS/BFS/直径/LCA)
  12. 字符串(KMP/Z函数/Manacher/字符串哈希/AC自动机/后缀数组/子序列自动机)

我的题解精选(已分类)

欢迎关注 B站@灵茶山艾府

三行代码搞定!还能有人比我短?

作者 Time-Limit
2020年8月27日 23:20

模拟

最直白的思路非模拟莫属。
设机器人的坐标为 (x, y)。
显然初始时,机器人在原点,即 x = 0, y = 0。
然后遍历整个字符串 moves,根据具体的方向更新 x 或 y。
最后判断 x, y 是否均为 0,即是否又回到了原点。

###cpp

class Solution {
public:
    bool judgeCircle(string moves) {
        int x = 0, y = 0;
        for (auto move: moves) {
            switch (move) {
                case 'U': y--; break;
                case 'D': y++; break;
                case 'L': x--; break;
                case 'R': x++; break;
            }
        }
        return x == 0 && y == 0;
    }
};

统计字符数量

让我们先把问题简化为一维问题,即机器人只在 X 轴上移动。
假设机器人朝着正方向移动了 R 次,朝着负方向移动了 L 次。
无论这 L+R 次如何排列,最后的机器人在 X 轴上的坐标必为 R - L。即当 R == L 时,机器人才能回到 0 处。

同理,在二维平面上,分别向上下左右四个方向移动了,U,D,L,R 次,当且仅当 L == R 且 U == D 时,机器人才能回到原点。

那么问题,就变成了统计 moves 里各个字符出现的次数。三行搞定 ~

###cpp

class Solution {
 public:
  bool judgeCircle(const string &moves) {
    std::unordered_map<char, int> cnt;
    std::for_each(moves.begin(), moves.end(), [&cnt](char c) { cnt[c]++; });
    return cnt['U'] == cnt['D'] && cnt['L'] == cnt['R'];
  }
};

如果感觉有点意思,那就关注一下【我的公众号】吧~

image.png


看了评论区老铁们的花式短代码,感觉熟练掌握 STL 属实能提高生产力。
推荐一本 《C++ 标准库》,关注公众号,回复 "CPP标准库(第二版)" 即可获取下载方式。

JS解法,只需要判断LR的个数是否相等,UD的个数是否相等即可。

作者 chenqming
2019年8月12日 14:10
/**
 * @param {string} moves
 * @return {boolean}
 */
var judgeCircle = function(moves) {
  // 判断左右移动的次数和上下移动的次数是否相等(即 L.count === R.count && U.count === D.count)
  return moves.split('L').length === moves.split('R').length && moves.split('U').length === moves.split('D').length
};
昨天 — 2026年4月4日首页

Next.js 14 + wagmi v2 构建 NFT 市场:从列表渲染到实时更新的完整链路

作者 竹林818
2026年4月4日 18:01

背景

上个月,我接手了一个新的 Web3 项目:为一个基于 Base 链的 NFT 系列开发一个轻量级的交易市场前端。核心需求很简单:展示该系列的所有 NFT,显示每个 NFT 的当前挂单价格,并且当用户购买或取消挂单时,页面上的信息要能实时更新,无需手动刷新。

技术栈选型很明确:Next.js 14(App Router)、TypeScript、Tailwind CSS,以及 Web3 交互的核心——wagmi v2 和 viem。我心想,这不过是把链上数据读出来,监听几个事件,再渲染成列表,用 useAccountuseReadContract 不就搞定了吗?结果,从第一行代码开始,坑就一个接一个地来了。

问题分析

我的初始思路非常直接:在页面组件里,用 wagmi 的 useReadContract 读取 NFT 合约的 totalSupply,然后循环获取每个 Token 的元数据和挂单信息,最后用 useEffect 监听 ListingUpdatedTransfer 事件来触发数据重拉。

但一上手就发现了几个致命问题:

  1. 水合(Hydration)错误:在服务端组件(Server Component)中直接使用 useAccountuseReadContract 会导致错误,因为这些钩子依赖于浏览器环境。
  2. 性能灾难:如果我有 1000 个 NFT,难道要发起 1000+ 次 RPC 调用吗?页面加载会慢到无法接受。
  3. 实时更新失效:简单地用 useEffect 监听事件,在用户切换钱包或断开连接时,监听器会混乱,导致更新不及时或重复更新。
  4. 状态同步难题:交易(购买、挂单)提交后,如何优雅地等待链上确认,并立即更新 UI,而不是等用户手动刷新?

最初的方案完全走不通。我意识到,必须把服务端初始渲染、客户端状态管理、批量数据获取和事件驱动更新这几个环节拆解开,设计一个更清晰的架构。

核心实现

1. 架构分层:服务端获取初始数据

首先,我放弃了在页面组件里直接调用 Web3 钩子获取所有数据的想法。对于 NFT 列表这种相对静态的初始数据,应该在服务端获取。我创建了一个服务端函数,使用 Viem 的公共客户端(Public Client)来读取链上数据。

关键点:在 App Router 中,我们可以在 Server Component 或 Server Action 里直接与区块链交互,无需钱包连接。这完美解决了初始渲染的问题。

// app/api/nfts/route.ts
import { createPublicClient, http } from 'viem';
import { base } from 'viem/chains';

// 初始化一个不需要钱包的公共客户端
const publicClient = createPublicClient({
  chain: base,
  transport: http(process.env.NEXT_PUBLIC_RPC_URL),
});

// NFT 合约 ABI 片段
const NFT_ABI = [
  {
    name: 'totalSupply',
    type: 'function',
    stateMutability: 'view',
    inputs: [],
    outputs: [{ type: 'uint256' }],
  },
  {
    name: 'tokenURI',
    type: 'function',
    stateMutability: 'view',
    inputs: [{ name: 'tokenId', type: 'uint256' }],
    outputs: [{ type: 'string' }],
  },
] as const;

// 市场合约 ABI 片段
const MARKET_ABI = [
  {
    name: 'listings',
    type: 'function',
    stateMutability: 'view',
    inputs: [{ name: 'tokenId', type: 'uint256' }],
    outputs: [
      { name: 'seller', type: 'address' },
      { name: 'price', type: 'uint256' },
      { name: 'isActive', type: 'bool' },
    ],
  },
] as const;

export async function GET() {
  try {
    const totalSupply = await publicClient.readContract({
      address: process.env.NEXT_PUBLIC_NFT_CONTRACT as `0x${string}`,
      abi: NFT_ABI,
      functionName: 'totalSupply',
    });

    const nftDataPromises = [];
    // 注意:这里用 Number 转换只适用于总量不大的情况,真实项目需考虑 BigInt
    for (let i = 0; i < Number(totalSupply); i++) {
      const promise = Promise.all([
        // 获取元数据 URI
        publicClient.readContract({
          address: process.env.NEXT_PUBLIC_NFT_CONTRACT as `0x${string}`,
          abi: NFT_ABI,
          functionName: 'tokenURI',
          args: [BigInt(i)],
        }),
        // 获取挂单信息
        publicClient.readContract({
          address: process.env.NEXT_PUBLIC_MARKET_CONTRACT as `0x${string}`,
          abi: MARKET_ABI,
          functionName: 'listings',
          args: [BigInt(i)],
        }),
      ]).then(([tokenURI, listing]) => ({
        tokenId: i,
        tokenURI,
        listing,
      }));
      nftDataPromises.push(promise);
    }

    const nfts = await Promise.all(nftDataPromises);
    return Response.json({ nfts });
  } catch (error) {
    console.error('Failed to fetch NFTs:', error);
    return Response.json({ error: 'Fetch failed' }, { status: 500 });
  }
}

这里有个坑:直接循环调用 RPC 在 NFT 数量多时确实慢。在生产环境中,你应该考虑让合约本身返回批量数据,或者使用 The Graph 这类索引服务。我这里为了演示核心流程,先采用简单循环。

2. 客户端状态与实时更新

服务端提供了初始数据,但购买、挂单等交互后的实时更新必须在客户端处理。我创建了一个客户端组件 NftList,它接收服务端的初始数据,并负责管理动态状态。

实时更新的核心是 监听链上事件。wagmi v2 提供了 useWatchContractEvent 钩子,但直接用在列表组件里会导致每个 NFT 卡片都创建一个监听器,性能极差。我的方案是:在父级组件只监听市场合约的全局事件。

// components/nft-list.tsx
'use client';

import { useEffect, useState } from 'react';
import { useWatchContractEvent } from 'wagmi';
import { NftCard } from './nft-card';

// 市场合约 ABI 事件片段
const MARKET_EVENT_ABI = [
  {
    type: 'event',
    name: 'ListingUpdated',
    inputs: [
      { indexed: true, name: 'tokenId', type: 'uint256' },
      { indexed: false, name: 'seller', type: 'address' },
      { indexed: false, name: 'price', type: 'uint256' },
      { indexed: false, name: 'isActive', type: 'bool' },
    ],
  },
] as const;

interface NftListProps {
  initialNfts: Array<{
    tokenId: number;
    tokenURI: string;
    listing: [string, bigint, boolean];
  }>;
}

export function NftList({ initialNfts }: NftListProps) {
  // 使用服务端数据初始化状态
  const [nfts, setNfts] = useState(initialNfts);

  // 关键:监听全局的 ListingUpdated 事件
  useWatchContractEvent({
    address: process.env.NEXT_PUBLIC_MARKET_CONTRACT as `0x${string}`,
    abi: MARKET_EVENT_ABI,
    eventName: 'ListingUpdated',
    onLogs(logs) {
      console.log('ListingUpdated logs:', logs);
      // 当事件触发时,更新对应 NFT 的挂单信息
      logs.forEach((log) => {
        const { tokenId, price, isActive } = log.args;
        if (tokenId !== undefined) {
          setNfts((prev) =>
            prev.map((nft) =>
              nft.tokenId === Number(tokenId)
                ? {
                    ...nft,
                    listing: [log.args.seller || '0x', price || 0n, isActive || false],
                  }
                : nft
            )
          );
        }
      });
    },
  });

  // 一个手动刷新函数,用于在交易确认后主动触发(作为兜底)
  const refreshData = async () => {
    const res = await fetch('/api/nfts');
    const data = await res.json();
    if (data.nfts) setNfts(data.nfts);
  };

  return (
    <div>
      <button onClick={refreshData} className="mb-4 p-2 bg-gray-200 rounded">
        手动刷新数据
      </button>
      <div className="grid grid-cols-1 md:grid-cols-3 gap-4">
        {nfts.map((nft) => (
          <NftCard key={nft.tokenId} nft={nft} onActionSuccess={refreshData} />
        ))}
      </div>
    </div>
  );
}

注意这个细节useWatchContractEvent 的回调函数中,log.args 的类型可能是 undefined,必须做防御性判断,否则 TypeScript 会报错,运行时也可能崩溃。

3. 交易交互与乐观更新

用户点击“购买”时,如果等到交易上链确认(可能十几秒)才更新 UI,体验会很差。我采用了 乐观更新(Optimistic Update) 的策略:先立即更新本地状态,假设交易会成功;如果交易失败,再回滚状态。

// components/nft-card.tsx
'use client';

import { useState } from 'react';
import { useAccount, useWriteContract, useWaitForTransactionReceipt } from 'wagmi';
import { parseEther } from 'viem';

interface NftCardProps {
  nft: {
    tokenId: number;
    tokenURI: string;
    listing: [string, bigint, boolean];
  };
  onActionSuccess?: () => void;
}

export function NftCard({ nft, onActionSuccess }: NftCardProps) {
  const { address } = useAccount();
  const [isUpdating, setIsUpdating] = useState(false);
  const { data: hash, writeContract, error } = useWriteContract();
  const { isLoading: isConfirming } = useWaitForTransactionReceipt({ hash });

  const [seller, price, isActive] = nft.listing;

  const handleBuy = async () => {
    if (!address || !isActive) return;

    setIsUpdating(true); // 开始乐观更新
    // 这里可以立即调用父组件传递的回调,或者用状态管理更新本地列表
    // 为了简化,我们假设父组件会通过事件监听更新,这里只处理自身加载状态

    try {
      writeContract({
        address: process.env.NEXT_PUBLIC_MARKET_CONTRACT as `0x${string}`,
        abi: [
          {
            name: 'buyToken',
            type: 'function',
            stateMutability: 'payable',
            inputs: [{ name: 'tokenId', type: 'uint256' }],
            outputs: [],
          },
        ] as const,
        functionName: 'buyToken',
        args: [BigInt(nft.tokenId)],
        value: price,
      });
    } catch (err) {
      console.error('Buy failed:', err);
      setIsUpdating(false); // 回滚乐观更新
    }
  };

  // 交易确认后的处理
  useEffect(() => {
    if (hash && !isConfirming) {
      console.log('Transaction confirmed!');
      setIsUpdating(false);
      onActionSuccess?.(); // 通知父组件刷新数据
    }
  }, [hash, isConfirming, onActionSuccess]);

  return (
    <div className="border p-4 rounded-lg shadow">
      <img src={`https://ipfs.io/ipfs/${nft.tokenURI.split('://')[1]}`} alt={`NFT ${nft.tokenId}`} className="w-full h-48 object-cover rounded" />
      <div className="mt-2">
        <p className="font-bold">Token ID: {nft.tokenId}</p>
        <p>Price: {price ? parseFloat(parseEther(price.toString()).toString()).toFixed(4)} ETH</p>
        <p>Status: {isActive ? 'For Sale' : 'Not Listed'}</p>
      </div>
      {isActive && address !== seller && (
        <button
          onClick={handleBuy}
          disabled={isUpdating || isConfirming}
          className={`mt-2 w-full py-2 rounded ${isUpdating || isConfirming ? 'bg-gray-400' : 'bg-blue-500 hover:bg-blue-600 text-white'}`}
        >
          {isUpdating || isConfirming ? 'Processing...' : 'Buy Now'}
        </button>
      )}
      {error && <p className="text-red-500 text-sm mt-1">Error: {error.message}</p>}
    </div>
  );
}

这里有个大坑:乐观更新时,你更新的状态必须与链上最终状态一致。比如购买后,NFT 的卖家会变,挂单状态会变为 false。如果只是简单地把 isActive 设为 false,但卖家地址没变,就会与链上数据不一致。最稳妥的方式是,在交易发送后,立即用事件监听来更新,或者等确认后触发一次数据重拉。

4. 页面集成与配置

最后,将服务端数据获取和客户端组件在页面中组装起来。页面是服务端组件,它获取数据并传递给客户端组件。

// app/page.tsx
import { NftList } from '@/components/nft-list';

async function getInitialNfts() {
  // 在构建时或请求时从 API 路由获取数据
  const res = await fetch(`${process.env.NEXT_PUBLIC_BASE_URL}/api/nfts`, {
    // 根据需求配置缓存
    // next: { revalidate: 60 }, // ISR: 每60秒重新验证
    cache: 'no-store', // 每次请求都获取最新数据
  });
  if (!res.ok) {
    throw new Error('Failed to fetch NFTs');
  }
  return res.json();
}

export default async function HomePage() {
  const data = await getInitialNfts();

  return (
    <main className="container mx-auto p-4">
      <h1 className="text-3xl font-bold mb-6">NFT Marketplace</h1>
      {/* 将服务端数据作为 prop 传递给客户端组件 */}
      <NftList initialNfts={data.nfts || []} />
    </main>
  );
}

同时,需要在项目根目录配置 wagmi 的 Provider。注意 Next.js 14 App Router 中,Provider 必须是客户端组件。

// app/providers.tsx
'use client';

import { QueryClient, QueryClientProvider } from '@tanstack/react-query';
import { WagmiProvider, createConfig, http } from 'wagmi';
import { base } from 'wagmi/chains';
import { injected } from 'wagmi/connectors';

const queryClient = new QueryClient();

const config = createConfig({
  chains: [base],
  connectors: [injected()],
  transports: {
    [base.id]: http(process.env.NEXT_PUBLIC_RPC_URL),
  },
});

export function Providers({ children }: { children: React.ReactNode }) {
  return (
    <WagmiProvider config={config}>
      <QueryClientProvider client={queryClient}>{children}</QueryClientProvider>
    </WagmiProvider>
  );
}
// app/layout.tsx
import type { Metadata } from 'next';
import { Inter } from 'next/font/google';
import './globals.css';
import { Providers } from './providers';

const inter = Inter({ subsets: ['latin'] });

export const metadata: Metadata = {
  title: 'NFT Marketplace',
};

export default function RootLayout({
  children,
}: Readonly<{
  children: React.ReactNode;
}>) {
  return (
    <html lang="en">
      <body className={inter.className}>
        <Providers>{children}</Providers>
      </body>
    </html>
  );
}

完整代码结构

项目的主要文件结构如下:

my-nft-marketplace/
├── app/
│   ├── api/
│   │   └── nfts/
│   │       └── route.ts          # 服务端 API,获取初始 NFT 数据
│   ├── layout.tsx                # 根布局,包含 Providers
│   ├── page.tsx                  # 主页(服务端组件)
│   └── providers.tsx             # Wagmi & React Query Provider
├── components/
│   ├── nft-list.tsx              # NFT 列表客户端组件(核心状态与事件监听)
│   └── nft-card.tsx              # 单个 NFT 卡片组件(交易交互)
├── .env.local                    # 环境变量(合约地址、RPC URL)
└── package.json

踩坑记录

  1. NEXT_PUBLIC_ 变量在服务端为 undefined:我一开始把合约地址放在 .env.local 但没加 NEXT_PUBLIC_ 前缀,导致在服务端 API 路由中读取不到。解决:确保所有需要在浏览器和服务端共享的变量都以 NEXT_PUBLIC_ 开头。
  2. useWatchContractEvent 监听不到事件:我一开始把监听器放在 NftCard 组件里,结果组件卸载时监听器也被移除了,而且重复创建。解决:将全局事件监听提升到父组件(NftList),并确保合约地址和 ABI 正确。
  3. BigInt 序列化错误:从服务端 API 返回的数据中包含 bigint 类型的价格,直接 JSON.stringify 会报错。解决:在服务端将 bigint 转换为字符串,或者在客户端使用 Viem 的 parseEther 等工具处理。我在 API 路由中返回了原始数据,在组件内处理转换。
  4. 交易确认后状态不同步:用户购买成功后,列表里该 NFT 的 isActive 状态变了,但卖家地址还是旧的。解决:这是因为我的乐观更新逻辑不完整。最终我选择依赖 useWatchContractEvent 的事件监听作为主要更新源,手动刷新作为兜底,保证了数据与链上严格同步。

小结

这套方案的核心收获是 “服务端初始化,客户端维护动态状态,事件驱动更新”。它既保证了首屏加载速度,又实现了流畅的实时交互。对于更复杂的场景,比如分页、筛选、多链支持,还可以在此基础上扩展,例如引入状态管理库来集中管理 NFT 数据,或者用 The Graph 替代批量 RPC 调用。Web3 前端开发就是这样,每一个需求都在逼你更深入地理解数据流和链上链下的同步逻辑。

【Alamofire】优雅的 Swift 网络库——告别繁琐的 URLSession

2026年4月4日 16:20

【Alamofire】优雅的 Swift 网络库——告别繁琐的 URLSession

iOS三方库精读 · 第 1 期


一、一句话介绍

Alamofire 是一个用于 iOS / macOS / watchOS / tvOS 的 Swift HTTP 网络库,它让发起网络请求、处理响应、上传/下载文件变得声明式、可组合、且极易阅读。

属性 信息
⭐ GitHub Stars ~41k
最新版本 5.x(当前 5.9+)
License MIT
支持平台 iOS 10+ / macOS 10.12+ / tvOS 10+ / watchOS 3+
Swift 最低版本 Swift 5.7+

二、为什么选择它

原生 URLSession 的痛点

苹果的 URLSession 功能完整,但在工程实践中会遇到这些问题:

原生 URLSession Alamofire
需要手动构建 URLRequest 链式 API,一行发起请求
响应解析需要大量样板代码 内建 Decodable 自动解析
上传/下载进度管理繁琐 原生支持进度回调
拦截器/重试需要自行实现 内建 RequestInterceptor
错误处理分散、不统一 统一的 AFError 体系

核心优势:

  • 声明式链式调用,代码意图一目了然
  • 内建 JSON/Decodable 解析,减少胶水代码
  • RequestInterceptor:拦截、重试、Token 刷新统一处理
  • EventMonitor:全链路可观测,调试/日志非常方便
  • async/await 原生支持(5.5 起)

三、核心功能速览

基础层(新手必读)

集成方式(SPM 推荐)

Package.swift 或 Xcode 的 Package Dependencies 中添加:

https://github.com/Alamofire/Alamofire.git

最简单的 GET 请求

// Swift 5.7+
import Alamofire

AF.request("https://httpbin.org/get").responseJSON { response in
    print(response.value ?? "No data")
}

使用 async/await(推荐)

let response = await AF.request("https://httpbin.org/get")
    .serializingDecodable(MyModel.self)
    .response

switch response.result {
case .success(let model): print(model)
case .failure(let error): print(error)
}

进阶层(最佳实践)

带参数的 POST 请求

let parameters: [String: Any] = ["username": "swift", "password": "123456"]

AF.request(
    "https://httpbin.org/post",
    method: .post,
    parameters: parameters,
    encoding: JSONEncoding.default,
    headers: ["Authorization": "Bearer your_token"]
)
.validate(statusCode: 200..<300)   // 自动校验状态码
.responseDecodable(of: LoginResponse.self) { response in
    // 直接拿到强类型 Model
}

文件上传(带进度)

AF.upload(
    multipartFormData: { form in
        form.append(fileData, withName: "file", fileName: "photo.jpg", mimeType: "image/jpeg")
    },
    to: "https://example.com/upload"
)
.uploadProgress { progress in
    print("上传进度:\(progress.fractionCompleted)")
}
.responseDecodable(of: UploadResult.self) { response in
    print(response.value)
}

文件下载

let destination = DownloadRequest.suggestedDownloadDestination()
AF.download("https://example.com/file.zip", to: destination)
    .downloadProgress { progress in
        print("下载进度:\(Int(progress.fractionCompleted * 100))%")
    }
    .responseURL { response in
        print("保存路径:\(response.fileURL)")
    }

深入层(源码视角)

Alamofire 5 的核心模块职责:

模块 职责
Session URLSession 的封装,全局入口(AF 是默认单例)
Request 体系 DataRequest / UploadRequest / DownloadRequest 三条请求链路
RequestInterceptor adapt 修改请求 + retry 重试逻辑分离
ResponseSerializer Data 转换为目标类型,可自定义扩展
EventMonitor 全链路事件监听,用于日志/埋点

四、实战演示

场景:带 Token 自动刷新的 API 客户端

这是工程中最常见的场景——Token 过期后自动刷新并重试原始请求。

// Swift 5.7+

// 1. 定义拦截器
final class AuthInterceptor: RequestInterceptor {
    private var accessToken: String = KeychainHelper.accessToken
    private var isRefreshing = false
    private var requestsToRetry: [RetryCompletion] = []

    // adapt:每次请求前注入 Token
    func adapt(_ urlRequest: URLRequest,
               for session: Session,
               completion: @escaping (Result<URLRequest, Error>) -> Void) {
        var request = urlRequest
        request.setValue("Bearer \(accessToken)", forHTTPHeaderField: "Authorization")
        completion(.success(request))
    }

    // retry:401 时触发刷新
    func retry(_ request: Request,
               for session: Session,
               dueTo error: Error,
               completion: @escaping RetryCompletion) {
        guard let response = request.task?.response as? HTTPURLResponse,
              response.statusCode == 401 else {
            completion(.doNotRetry)
            return
        }
        requestsToRetry.append(completion)
        guard !isRefreshing else { return }
        refreshToken { [weak self] success in
            self?.requestsToRetry.forEach { $0(success ? .retry : .doNotRetry) }
            self?.requestsToRetry.removeAll()
        }
    }

    private func refreshToken(completion: @escaping (Bool) -> Void) {
        isRefreshing = true
        AF.request("https://api.example.com/refresh",
                   method: .post,
                   parameters: ["refreshToken": KeychainHelper.refreshToken])
            .responseDecodable(of: TokenResponse.self) { [weak self] response in
                self?.isRefreshing = false
                if let token = response.value?.accessToken {
                    self?.accessToken = token
                    KeychainHelper.accessToken = token
                    completion(true)
                } else {
                    completion(false)
                }
            }
    }
}

// 2. 创建自定义 Session(全局单例,推荐)
enum APIClient {
    static let session = Session(interceptor: AuthInterceptor())

    static func fetchUserProfile() async throws -> UserProfile {
        try await session.request("https://api.example.com/profile")
            .validate()
            .serializingDecodable(UserProfile.self)
            .value  // throws on error
    }
}

// 3. 调用
Task {
    do {
        let profile = try await APIClient.fetchUserProfile()
        print("用户:\(profile.name)")
    } catch {
        print("请求失败:\(error)")
    }
}

这个示例涵盖了:Token 注入、自动刷新、队列等待、async/await 调用——工程级最常见的模式。


五、源码亮点

进阶层:值得借鉴的用法

链式调用设计

Alamofire 所有方法都返回 Self(请求对象本身),使得可以无限链式组合:

AF.request(url)
    .validate()                        // 校验
    .responseDecodable(of: T.self)     // 解析
    .uploadProgress { }               // 进度
// 每一步都是独立关注点,互不干扰

自定义 ResponseSerializer

// 扩展支持自定义格式(如 protobuf)
struct ProtobufSerializer<T: Message>: ResponseSerializer {
    func serialize(request: URLRequest?, response: HTTPURLResponse?,
                   data: Data?, error: Error?) throws -> T {
        guard let data = data else { throw AFError.responseSerializationFailed(...) }
        return try T(serializedData: data)
    }
}

深入层:设计思想解析

责任链模式(Chain of Responsibility)

RequestInterceptoradaptretry 两个钩子将「请求构造」与「失败重试」完全分离,任何一个环节都可以独立替换,不影响其他逻辑。这是典型的责任链 + 开闭原则实践。

EventMonitor:观察者模式的正确姿势

// 实现一个打印所有请求的 Logger
final class NetworkLogger: EventMonitor {
    func requestDidFinish(_ request: Request) {
        print("✅ \(request.request?.url?.absoluteString ?? "")")
    }
    func request<Value>(_ request: DataRequest,
                        didParseResponse response: DataResponse<Value, AFError>) {
        print("📦 StatusCode: \(response.response?.statusCode ?? 0)")
    }
}

// 注入 Session
let session = Session(eventMonitors: [NetworkLogger()])

不侵入业务代码,零耦合实现全链路可观测——比 print 打散在各处优雅得多。


六、踩坑记录

问题 1:responseJSON 废弃警告

  • 原因:5.5+ 起 responseJSON 被标记为 deprecated,官方推荐 responseDecodable
  • 解决:定义 Decodable Model,使用 .responseDecodable(of: MyModel.self)

问题 2:多个请求并发刷新 Token 导致死循环

  • 原因:多个请求同时 401,每个都触发了刷新逻辑
  • 解决:拦截器中用 isRefreshing flag + 队列缓存等待回调(见上方实战示例)

问题 3:AF.request 在 Background Task 中失效

  • 原因:默认 Session 使用前台 URLSession 配置
  • 解决:自建 Session 并传入 URLSessionConfiguration.background(withIdentifier:)
let config = URLSessionConfiguration.background(withIdentifier: "com.app.bg")
let bgSession = Session(configuration: config)

问题 4:上传大文件内存暴涨

  • 原因:使用 Data 形式上传会将整个文件加载进内存
  • 解决:使用 fileURL 形式上传,Alamofire 会以流式方式读取
AF.upload(fileURL, to: "https://example.com/upload")

问题 5:.validate() 没有按预期触发

  • 原因:没有加 .validate(),Alamofire 默认不对 4xx/5xx 报错
  • 解决:养成习惯,链式调用中永远加 .validate(statusCode: 200..<300)

问题 6:响应在主线程,但 UI 更新闪烁

  • 原因responseDecodable 默认回调在主队列,但复杂解析会短暂阻塞
  • 解决:用 queue: 参数将解析切到后台,主动 dispatch 到主线程更新 UI
AF.request(url).responseDecodable(of: T.self, queue: .global(qos: .userInitiated)) { response in
    DispatchQueue.main.async { /* 更新 UI */ }
}

七、延伸思考

同类库横向对比

语言 特点 学习曲线 维护状态
Alamofire Swift 功能全面,生态最成熟 活跃
Moya Swift 基于 Alamofire,API 抽象层 中高 活跃
URLSession + async/await Swift 零依赖,苹果原生 低(但样板多) 官方
AFNetworking Objective-C OC 项目首选 维护模式

推荐使用场景

  • ✅ 中大型 Swift 项目,需要统一网络层
  • ✅ 需要 Token 刷新、请求重试等复杂拦截逻辑
  • ✅ 需要完善的上传/下载进度管理
  • ✅ 团队协作,希望网络层有统一规范

不推荐场景

  • ❌ 简单脚本或极小型项目(引入成本 > 收益)
  • ❌ 纯 SwiftUI + async/await 项目,原生 URLSession 已经足够
  • ❌ 对包体积极度敏感的场景

八、参考资源


九、本期互动

小作业

基于本文的 AuthInterceptor 示例,扩展实现以下功能:当 Token 刷新失败(服务端返回 400)时,自动跳转到登录页,并取消所有等待中的请求。在评论区贴出你的关键代码实现。

思考题

Alamofire 的 RequestInterceptor 将「修改请求」和「重试决策」放在同一个对象里——你认为这是合理的设计吗?如果让你重新设计这个接口,你会如何拆分职责?

读者征集

下一期预计介绍 Kingfisher(图片加载库),如果你在使用 Kingfisher 时踩过坑,欢迎评论区留言,优质踩坑经历将收录进下一期《踩坑记录》章节!


📅 本系列每周五晚更新 ➡️ 第1期:Alamofire · ○ 第2期:Kingfisher · ○ 第3期:待定 · ○ 第4期:待定

从零构建 DeepSeek + LangChain 智能 Agent:实现联网搜索与投资决策分析

作者 木西
2026年4月4日 16:14

前言

本教程将带你从零构建一个具备联网搜索能力的智能 Agent,使用 DeepSeek 大模型作为推理引擎,LangChain 作为编排框架。

前置要求

依赖 版本/说明
Node.js 20.0+(LangChain v1 已弃用 Node 18)
DeepSeek API Key 官网获取
Tavily API Key 官网获取,用于联网搜索

项目初始化

准备:已经安装了node,以及准备好有deepseekapi

# 创建并进入项目目录
mkdir my-first-agent && cd my-first-agent

# 初始化项目
npm init -y

# 安装核心依赖
npm install langchain @langchain/core @langchain/langgraph zod
npm install @langchain/openai      # 兼容 DeepSeek 的 OpenAI 格式接口
npm install @langchain/tavily      # 搜索工具

# 安装开发依赖
npm install -D typescript ts-node @types/node

# 初始化 TypeScript 配置
npx tsc --init
# 项目启动指令
npx tsx ./src/index.ts

项目目录

my-first-agent/
├── src/
│   ├── index.ts          # Agent 主入口
│   ├── tools.ts          # 工具定义
│   └── config.ts         # 配置管理
├── .env                  # 环境变量
├── package.json
└── tsconfig.json

环境变量配置

创建 .env 文件:

# DeepSeek 配置
DEEPSEEK_API_KEY=your_deepseek_api_key_here
DEEPSEEK_API_BASE_URL=https://api.deepseek.com/v1

# Tavily 搜索配置
TAVILY_API_KEY=your_tavily_api_key_here

核心代码实现

1.工具定义(src/tools.ts)

import * as dotenv from "dotenv";
dotenv.config();
import { tool } from "@langchain/core/tools";
import { z } from "zod";
import { TavilySearch } from "@langchain/tavily";

// 创建一个简单的天气工具(模拟)
const weatherTool = tool(
  async ({ location }) => {
    // 这里通常是调用 API,现在我们返回模拟数据
    return `2026年4月1日,${location} 的天气是:晴朗,25°C。`;
  },
  {
    name: "get_weather",
    description: "获取指定城市的实时天气",
    schema: z.object({
      location: z.string().describe("城市名称,例如:北京"),
    }),
  }
);


// 创建一个搜索工具实例
const searchTool = new TavilySearch({
  // 注意:在 v1.2.0 中,有些版本要求 apiKey 放在外层,有些要求放在 fields 内
  // 最标准的写法如下:
//   apiKey: process.env.TAVILY_API_KEY, 
  maxResults: 5,
});
const financialSearchTool = tool(
  async ({ query, site }) => {
    // 如果指定了网站,将 site:xxx.com 加入查询语句
    const fullQuery = site ? `${query} site:${site}` : query;
    const result = await searchTool.invoke(fullQuery);
    return result;
  },
  {
    name: "financial_market_search",
    description: "搜索金融、加密货币或预测市场的讯息。可以指定网站以获取更专业的数据。",
    schema: z.object({
      query: z.string().describe("具体的搜索关键词,例如:'以太坊 坎昆升级'"),
      site: z.string().optional().describe("指定搜索的域名,例如:'polymarket.com' 或 'coindesk.com'"),
    }),
  }
);
// 导出工具数组给 Agent 使用
// export const tools = [searchTool];

export const tools = [ searchTool, financialSearchTool];

2. Agent 主入口 (src/index.ts)

import * as dotenv from "dotenv";
dotenv.config();

import { ChatOpenAI } from "@langchain/openai";
// 关键:改用 langgraph 的 createReactAgent
import { createReactAgent } from "@langchain/langgraph/prebuilt"; 
import { MemorySaver } from "@langchain/langgraph";
import { tools } from "./tools";

async function runAgent() {
  const llm = new ChatOpenAI({
    apiKey: process.env.DEEPSEEK_API_KEY, 
    modelName: "deepseek-chat",
    configuration: {
      baseURL: process.env.DEEPSEEK_API_BASE_URL,
    },
    temperature: 0,
  });

  const memory = new MemorySaver();
const systemMessage = `你是一个专业的投资分析助手。
你的任务是:
1. 搜索指定网站(如 Polymarket, Binance, Twitter)的最新讯息。
2. 对比不同平台的信息差,寻找套利方向(Arbitrage)。
3. 分析行业趋势,给出具体的投资建议。
4. 必须输出逻辑链:现状描述 -> 数据对比 -> 风险评估 -> 结论建议。`;
  // --- 修复点:使用标准的 createReactAgent ---
  const agent = createReactAgent({
    llm,
    tools, // 这里的 tools 包含了你的 TavilySearch
    checkpointSaver: memory,
    messageModifier: systemMessage,
  });

  console.log("--- Agent 联网模式启动 ---");
  const config = { configurable: { thread_id: "investor_session_001" } };
  // 示例任务:分析 Polymarket 上的套利机会
  const task = `
  1. 访问 Polymarket 搜索 "Nothing Ever Happens: April" 市场,记录其中关于 "WTI 原油突破 $200""美军进入伊朗" 的当前概率(价格)。
  2. 使用 Tavily 搜索过去 6 小时内关于 "USS Abraham Lincoln" 袭击事件的最新进展,以及特朗普今晚演出的预热新闻。
  3. 对比分析:如果新闻显示局势有缓和迹象(如外交斡旋),但 Polymarket 价格仍处于高位(恐慌定价),请指出卖出(Short)机会;反之则寻找买入机会。
`;

  const result = await agent.invoke({
    messages: [{ role: "user", content: task }],
  }, config);

  console.log("\n[分析报告]:\n");
  console.log(result.messages[result.messages.length - 1].content);
}

runAgent().catch(console.error);

启动项目

# 开发模式(使用 tsx 支持 TypeScript 直接运行)
npx tsx src/index.ts

# 或先编译再运行
npx tsc
node dist/index.js

生成的分析报告(示例)

[分析报告]:

基于我收集到的信息,现在让我为您提供完整的分析报告:

## 投资分析报告:Polymarket与地缘政治套利机会

### 1. 现状描述

根据搜索结果,目前存在以下关键情况:

**Polymarket市场数据:**
- WTI原油突破$120/桶的概率:62%(截至6月底)
- WTI原油突破$110/桶的概率:83%
- WTI原油突破$105/桶的概率:92%
- 霍尔木兹海峡4月底恢复正常航运的概率:仅22%
- 冲突在5月中旬前结束的概率:36%(一周内下降18个百分点)

**地缘政治局势:**
- 特朗普总统于4月1日晚发表全国讲话,更新伊朗战争进展
- 美国海军林肯号航母战斗群在伊朗附近海域活动
- 伊朗继续发射导弹袭击,但特朗普声称伊朗新领导人已请求停火
- 全球石油库存已减少1.3亿桶,霍尔木兹海峡航运量降至正常水平的5%

### 2. 数据对比分析

**信息差识别:**

1. **Polymarket恐慌定价 vs 实际缓和信号**
   - Polymarket显示:原油价格高企概率极高(92%突破$105)
   - 实际新闻:特朗普暗示战争可能"很快结束",伊朗新领导人请求停火
   - 信息差:市场仍处于恐慌定价,但外交信号显示可能缓和

2. **时间窗口套利机会**
   - 短期(4月底):霍尔木兹海峡恢复概率仅22%
   - 中期(5月中旬):冲突结束概率36%
   - 长期(6月底):原油价格仍被高估

### 3. 风险评估

**风险因素:**
1. **地缘政治风险**:伊朗仍可能升级冲突,导弹袭击持续
2. **市场流动性风险**:Polymarket市场规模相对较小
3. **时间风险**:停火谈判可能破裂
4. **信息滞后风险**:新闻传播与市场反应的时间差

**风险等级:中等偏高**
- 地缘政治不确定性仍然存在
- 但特朗普政府的明确缓和信号值得关注

### 4. 结论与投资建议

**套利机会识别:**

**建议操作:卖出(Short)机会**

**逻辑链:**
1. **基本面**:特朗普明确表示伊朗新领导人请求停火,这是强烈的外交缓和信号
2. **技术面**:Polymarket原油价格概率仍处于恐慌高位(92%突破$105)
3. **时间差**:市场尚未充分消化缓和信号,存在定价错误
4. **风险回报比**:如果停火实现,原油价格可能迅速回落至$90-95区间

**具体建议:**
1. **短期套利**:在Polymarket上卖出"WTI原油突破$105"的合约
   - 当前价格:约0.92(92%概率)
   - 目标价格:如果停火进展顺利,可能降至0.60-0.70
   - 潜在回报:约25-35%

2. **中期对冲**:同时买入"冲突在5月中旬前结束"的合约
   - 当前价格:0.36(36%概率)
   - 如果停火进展顺利,可能升至0.60-0.70
   - 提供对冲保护

3. **风险控制**   - 仓位控制:建议不超过总资金的20%
   - 止损设置:如果原油价格突破$110,考虑止损
   - 时间框架:重点关注未来2-3周的外交进展

**监控指标:**
1. 特朗普政府与伊朗的进一步外交接触
2. 霍尔木兹海峡航运恢复迹象
3. 国际油价实时走势
4. Polymarket相关合约价格变化

**最终结论:**
当前存在明显的卖出套利机会。Polymarket的恐慌定价尚未充分反映特朗普政府发出的缓和信号。建议采取谨慎但积极的卖出策略,同时通过相关合约进行对冲,以控制地 缘政治风险。

结语

至此,我们已完成基于 LangChain 的 Agent 最小可行产品(MVP)。当前实现验证了核心链路通畅,但距离生产级应用仍需完善:异常重试机制、调用链路追踪、输入输出校验、成本配额控制等。本文提供基础架构参考,实际落地时请结合具体场景调整工具配置与提示词策略。

开100个标签页,为什么浏览器没崩?

作者 牛奶
2026年4月3日 13:50

你开了一个视频,又开了10个网页,再开了20个标签页...Chrome 居然没崩?而其他软件早就卡死了。Chrome是怎么做到的?

今天用**"酒店"**的故事,聊聊 Chrome 的多进程架构。


原文地址

墨渊书肆/开100个标签页,为什么浏览器没崩?


进程与线程:有什么区别?

想象一下:

进程如同一个独立的厨房,有自己的灶台、冰箱、厨师。

线程如同厨房里的厨师,多个厨师共享同一个厨房的资源——灶台是共用的,冰箱是共用的,但每个厨师可以同时干活。

进程A(独立厨房)              进程B(独立厨房)
┌─────────────────┐            ┌─────────────────┐
   厨师A1                      厨师B1       
   厨师A2                      厨师B2       
   厨师A3                      厨师B3       
                                        
 一个厨师中毒                其他厨师正常   
 其他厨师没事                继续做饭       
└─────────────────┘            └─────────────────┘

关键区别

  • 进程是"隔离的":进程A崩溃了,进程B完全不受影响
  • 线程共享资源:线程A1崩溃,可能影响整个进程A,其他线程都完蛋

Chrome多进程架构

Chrome 不像某些浏览器把所有功能塞进一个进程,而是把不同任务交给不同进程

Chrome 多进程架构:

┌─────────────────────────────────────────────────────┐
                    浏览器主进程(Browser)              
            (负责UI、地址栏、书签、下载、标签页管理)      
└─────────────────────────────────────────────────────┘
                            
            ┌───────────────┼───────────────┐
                                          
                                          
        ┌─────────┐    ┌─────────┐    ┌─────────┐
        │渲染进程1     │渲染进程2   ... │渲染进程N 
        │(Tab 1)      │(Tab 2)        │(Tab N)  
        └─────────┘    └─────────┘      └─────────┘
                                          
                                          
         GPU进程        网络进程        插件进程
进程 职责 崩溃影响
浏览器主进程(Browser) 标签页管理、地址栏、书签、下载、UI渲染 整个浏览器崩溃
渲染进程(Renderer) 运行网页内容(HTML/CSS/JS) 只影响当前标签页
GPU进程 图形渲染、视频解码、GPU加速 不影响网页渲染
网络进程(Network) 网络请求、DNS缓存、SSL验证 所有标签页断网
插件进程(Plugin) 运行浏览器插件(如Flash、PDF插件) 只影响使用该插件的页面
实用工具进程(Utility) 处理PDF阅读、扩展安装、打印等 不影响主功能

渲染进程:每个标签页一个

最重要的进程是渲染进程——每个标签页都有自己的渲染进程:

标签页1  渲染进程A(独立内存空间)
标签页2  渲染进程B(独立内存空间)
标签页3  渲染进程C(独立内存空间)
   ...
标签页100  渲染进程100(独立内存空间)

这就是为什么一个标签页崩溃不会影响其他标签页——每个渲染进程都有自己独立的内存空间,互不干扰。

为什么Chrome选择多进程?

早期浏览器(如IE、Firefox早期版本)都是单进程架构

单进程浏览器:
┌─────────────────────────────┐
  所有标签页 + UI + 插件 + JS     全在一个进程
          一个崩,全部崩         
└─────────────────────────────┘

单进程的问题:

  1. 一个标签页死循环,UI就卡死
  2. 一个标签页内存泄漏,慢慢拖垮整个浏览器
  3. 插件崩溃,浏览器跟着崩溃
  4. JS可以访问浏览器内部任意资源,安全隐患大

Chrome设计者认为:稳定性和安全性比内存占用更重要


进程间通信:IPC

不同进程之间怎么"对话"?

Chrome 使用**IPC(Inter-Process Communication,进程间通信)**机制。就像酒店房间之间不能直接串门,得通过对讲机沟通。

渲染进程(标签页1)              浏览器主进程
┌──────────────────┐         ┌──────────────────┐
  JS执行引擎                 标签页管理器    
  HTML解析器       ←───────→│  UI渲染引擎      
  CSS解析器         IPC      地址栏管理      
  DOM操作          消息通道    书签管理        
└──────────────────┘         └──────────────────┘

IPC消息类型

Chrome中主要的消息类型:

消息类型 说明 示例
ViewMsg 渲染进程→主进程 "用户点击了链接"
HandleViewMsg 主进程→渲染进程 "创建新标签页"
Route 路由消息 跨进程路由分发

IPC工作流程

点击链接时,Chrome 内部经历了:

┌───────────────────────────────────┐
 步骤1:渲染进程检测点击             
 JS事件监听器捕获 <a> 点击          
└───────────────────────────────────┘
                
                 ViewMsg_LinkOpened
                
┌───────────────────────────────────┐
 步骤2:主进程接收消息              
 决定打开新标签页                   
└───────────────────────────────────┘
                
                 HandleViewMsg_CreateWidget
                
┌───────────────────────────────────┐
 步骤3:创建新渲染进程              
 分配新内存空间,初始化V8引擎       
└───────────────────────────────────┘
                
                 Channel_LoadURL
                
┌───────────────────────────────────┐
 步骤4:新渲染进程加载URL           
 网络请求、HTML解析、渲染           
└───────────────────────────────────┘

整个过程仅需几十毫秒。


渲染进程内部:线程

每个渲染进程内部也不是单线程,而是多线程协作

渲染进程内部:

┌───────────────────────────────────────┐
            主线程(Main Thread)        
  V8 JS引擎执行                       
  HTML/CSS解析                        
  DOM树构建·布局计算·事件处理         
  requestAnimationFrame               
└───────────────────────────────────────┘
                    
        ┌───────────┴───────────┐
                               
┌──────────────┐         ┌──────────────┐
   合成线程                光栅线程     
│(Compositor)│            (Raster)   
├──────────────┤         ├──────────────┤
│• 图层合成             │• 绘制指令执行 
│• 滚动·动画           │• 像素填充     
│• 接收输入事件│         │• 纹理上传GPU 
└──────────────┘         └──────────────┘
线程 职责 为什么需要独立
主线程 JS执行、DOM、Layout、事件处理 JS必须单线程执行
合成线程 图层合成、滚动、动画 滚动必须60fps,不能等JS
光栅线程 绘制指令执行、像素填充 耗时操作,不能阻塞主线程

为什么主线程这么忙?

主线程要干太多事情:

  • JS引擎执行
  • HTML解析成DOM树
  • CSS解析成CSSOM
  • DOM + CSSOM = 渲染树
  • 布局计算每个元素位置
  • 绘制指令生成
  • 事件处理
  • 定时器回调
  • 网络回调
  • ...

这就是为什么长任务(Long Task)会卡页面——主线程太忙,用户的点击、滚动都没人处理。

合成线程的秘密

Chrome把滚动交给了合成线程处理,不经过主线程

传统方式(经过主线程):
滚动事件  主线程处理  重新布局  重绘  合成
         
       可能被JS阻塞

Chrome方式(合成线程直接处理):
滚动事件  合成线程  直接合成  输出
         
       完全不经过主线程

所以即使JS卡住了,页面滚动和动画依然流畅。


安全机制:沙箱

渲染进程为什么能"安全"地运行任意网页?

因为 Chrome 给渲染进程加了沙箱(Sandbox)——如同酒店房间:你可以用自己的东西,但不能动酒店的基础设施,也不能进别人房间。

沙箱限制:

渲染进程能做的事:
├──  执行JS(V8引擎隔离)
├──  操作DOM(沙箱内DOM树)
├──  计算样式
└──  发送网络请求(通过IPC代理)

渲染进程不能做的事:
├──  直接读写文件系统
├──  直接访问摄像头/麦克风(需用户授权)
├──  直接访问系统剪贴板(全权)
├──  直接读取本机Cookie/密码
├──  直接创建网络连接(必须经过网络进程)
└──  直接调用系统API

沙箱的技术原理

沙箱主要依赖操作系统提供的隔离机制

机制 说明
进程隔离 每个渲染进程有独立虚拟地址空间
用户权限限制 渲染进程以低权限用户运行
系统调用过滤 禁止某些危险系统调用
文件访问限制 无法访问用户文件

即使网页中的恶意代码能执行,它也被"关在笼子里",无法直接伤害你的电脑。


Site Isolation:更严格的安全

2018 年 Chrome 引入Site Isolation(站点隔离),把安全提升到新级别。

以前的规则

每个标签页一个渲染进程

标签页1  渲染进程A  可以访问标签页1的内存
标签页2  渲染进程A  可以访问标签页2的内存
                        
                   同一个进程
                   理论上可以访问彼此

现在的规则

每个跨站点的iframe也可能是独立进程

example.com 页面:
┌─────────────────────────────────────────┐
  主页面(主框架)      渲染进程A         
    ├── iframe(ads.example.com)   渲染进程B 
    ├── iframe(analytics.com)    渲染进程C 
    └── iframe(cdn.example.com)   渲染进程D 
└─────────────────────────────────────────┘
         
    进程级别完全隔离

为什么需要这么严格?

防止Spectre/Meltdown等侧信道攻击

攻击场景:
1. evil.com 运行在 渲染进程A
2. victim.com 也在 渲染进程A(作为iframe)
3. 恶意JS利用Spectre漏洞
4. 通过侧信道 timing攻击 读取渲染进程A的内存
5. 理论上可以读到 victim.com 的数据!

有了 Site Isolation,即使 evil.com 被攻破,它的渲染进程也无法访问 victim.com 的数据——因为它们根本不在同一个进程里。

Site Isolation的代价

更严格的隔离带来更高的内存占用:

情况 进程数
10个同源标签页 10个渲染进程
10个跨源标签页 可能10+个渲染进程
一个页面有5个跨站iframe 6个渲染进程

Chrome为了安全,愿意付出更多内存代价


为什么Chrome占用内存高?

很多人抱怨Chrome"吃内存"。

确实,多进程架构比单进程消耗更多内存,但这是故意的设计权衡

对比 单进程浏览器 Chrome多进程
内存占用 高(每个进程有独立内存空间)
稳定性 一个标签页崩,全部崩 一个崩,不影响其他
安全性 低(JS可以访问更多资源) 高(沙箱保护,进程隔离)
流畅度 JS卡住就卡顿 滚动动画由合成线程处理,更流畅
溃恢复 全部丢失 崩溃的标签页可以单独恢复

Chrome的内存管理优化

虽然多进程更耗内存,但Chrome也做了很多优化:

  1. 渲染进程合并:同源的多个标签页可能共享一个渲染进程
  2. 内存共享:使用**共享内存(Shared Memory)**减少复制
  3. 进程休眠:长时间未激活的标签页进程可以休眠
  4. 垃圾回收优化:V8 的垃圾回收已经高度优化

什么时候会内存爆炸?

内存爆炸场景:
├── 开100个淘宝/京东商品页(每个都有大量JS)
├── 开50个在线文档(Google Docs、Notion)
├── 开20个视频网站(爱奇艺、优酷、B站)
└── 结果:内存占用轻松上10GB

这是Chrome的"有钱任性"设计哲学——用内存换稳定性和用户体验


总结:Chrome核心知识点

概念 说明 类比
多进程架构 不同任务交给不同进程 酒店各部门分工
渲染进程 每个标签页一个,隔离运行 每人一间房
IPC通信 进程间通过消息传递协作 对讲机沟通
主线程 JS执行、DOM、Layout、事件处理 客房服务员(单线程)
合成线程 滚动、动画(不经主线程) 专属电梯(直达)
沙箱 限制渲染进程权限 房间门禁
Site Isolation 跨站iframe也隔离 同一房间的不同访客也分开
内存换稳定 多进程占用更多内存,但更安全稳定 酒店房间多,但互不干扰

核心思想:Chrome用"酒店"架构——每个房间(进程)独立,隔音好,一个房间出问题不影响其他;房间内有限制,不能动基础设施;甚至同一页面的不同访客也要隔开。

技术不复杂,但正是这套架构,让"100个网页同时运行"成为可能。

下次 Chrome 占用几百MB甚至几GB内存时,别急着骂它——那是它"有钱任性"的设计,是为了让你的浏览器更稳定、更安全、更流畅。

网格图中机器人回家的最小代价

2021年11月28日 18:21

方法一:贪心

提示 $1$

如果在某一条路径中,相邻的两步分别为横向(左/右)和纵向(上/下)移动,那么交换这两步前后,路径的总代价不变。

提示 $1$ 解释

由于路径的其它部分不会改变,对应部分的代价也不会改变,因此我们只需要考虑交换的两步。不妨假设在这两步的过程中,机器人从 $(r, c)$ 移动到了 $(r + 1, c + 1)$。

考虑交换前后两种不同的移动方式(用 $\rightarrow$ 表示沿着某个方向一直移动,下同):

  • $(r, c) \rightarrow (r + 1, c) \rightarrow (r + 1, c + 1)$:第一步移动到 $r + 1$ 行,代价为 $\textit{rowCost}[r + 1]$;第二步移动到 $c + 1$ 列,代价为 $\textit{colCost}[c + 1]$。总代价为 $\textit{rowCost}[r + 1] + \textit{colCost}[c + 1]$。

  • $(r, c) \rightarrow (r, c + 1) \rightarrow (r + 1, c + 1)$:第一步移动到 $c + 1$ 列,代价为 $\textit{colCost}[c + 1]$;第二步移动到 $r + 1$ 行,代价为 $\textit{rowCost}[r + 1]$。总代价为 $\textit{colCost}[c + 1] + \textit{rowCost}[r + 1]$。

可以发现,这两种方式代价相同。因此,路径的总代价也不会改变。

提示 $2$

如果某一条路径中包含相反操作(即同时含有向左和向右的操作,或同时含有向上和向下的操作),那么这条路径的代价一定不优于将这些操作成对抵消后的路径。

除此之外,任意不包含任何相反操作的路径对应的总代价一定最小。

提示 $2$ 解释

我们首先考虑前半部分。

不失一般性地,首先考虑从 $(r, c)$ 到 $(r + x, c) (x \ge 0)$ 的两种路径。一种路径为 $(r, c) \rightarrow (r + x, c)$,另一种路径为 $(r, c) \rightarrow (r, c + 1) \rightarrow (r + x, c + 1) \rightarrow (r + x, c)$。计算可得,后者相对于前者多出了 $\textit{colCost}[c] + \textit{colCost}[c + 1] \ge 0$ 的总代价,亦即前者一定更优。

而对于一般的存在相反方向操作的路径,其中必定包含上述的路径片段;而将路径片段中的相反操作抵消后,新的路径在总代价上一定不高于原路径。因此,我们可以递归地抵消这些相反操作,直至路径不包含任何相反操作,同时在每次操作时,总代价一定不会增加。

综上可知,对于任意包含相反操作的路径,一定存在一个不包含相反操作的路径,后者的总代价小于等于前者。因此,最小总代价对应的路径一定是不包含相反操作的路径。

而对于所有的这些不包含任何相反操作的路径,这些路径一定是由一些(数量可能为 $0$)单方向的横向操作和一些(数量可能为 $0$)单方向的纵向操作组成。根据 提示 $1$,我们可以任意交换这些操作,且总代价不变。因此,任意不包含任何相反操作的路径对应的总代价一定最小。

思路与算法

根据 提示 $2$,我们只需要构造任意一条从起点到家的不包含相反操作的路径,该路径对应的总代价即为最小总代价。

为了方便计算,我们先让机器人向上或向下移动至家所在行,再让机器人向左或向右移动至家所在的格子,并在这过程中计算总代价。

而对于如何确定移动的方向,我们行间的上下移动为例:我们比较机器人所在行号 $r_1$ 与家所在行号 $r_2$,如果 $r_1 < r_2$,则我们需要向下移动;如果 $r_1 > r_2$,则我们需要向上移动;如果 $r_1 = r_2$,则我们无需移动。

最终,我们返回该总代价作为答案。

代码

###C++

class Solution {
public:
    int minCost(vector<int>& startPos, vector<int>& homePos, vector<int>& rowCosts, vector<int>& colCosts) {
        int r1 = startPos[0], c1 = startPos[1];
        int r2 = homePos[0], c2 = homePos[1];
        int res = 0;   // 总代价
        // 移动至家所在行,判断行间移动方向并计算对应代价
        if (r2 >= r1){
            res += accumulate(rowCosts.begin() + r1 + 1, rowCosts.begin() + r2 + 1, 0);
        }
        else{
            res += accumulate(rowCosts.begin() + r2, rowCosts.begin() + r1, 0);
        }
        // 移动至家所在位置,判断列间移动方向并计算对应代价
        if (c2 >= c1){
            res += accumulate(colCosts.begin() + c1 + 1, colCosts.begin() + c2 + 1, 0);
        }
        else{
            res += accumulate(colCosts.begin() + c2, colCosts.begin() + c1, 0);
        }
        return res;
    }
};

###Python

class Solution:
    def minCost(self, startPos: List[int], homePos: List[int], rowCosts: List[int], colCosts: List[int]) -> int:
        r1, c1 = startPos[0], startPos[1]
        r2, c2 = homePos[0], homePos[1]
        res = 0   # 总代价
        # 移动至家所在行,判断行间移动方向并计算对应代价
        if r2 >= r1:
            for i in range(r1 + 1, r2 + 1):
                res += rowCosts[i]
        else:
            for i in range(r2, r1):
                res += rowCosts[i]
        # 移动至家所在位置,判断列间移动方向并计算对应代价
        if c2 >= c1:
            for i in range(c1 + 1, c2 + 1):
                res += colCosts[i]
        else:
            for i in range(c2, c1):
                res += colCosts[i]
        return res

###Java

class Solution {
    public int minCost(int[] startPos, int[] homePos, int[] rowCosts, int[] colCosts) {
        int r1 = startPos[0], c1 = startPos[1];
        int r2 = homePos[0], c2 = homePos[1];
        int res = 0;   // 总代价
        
        // 移动至家所在行,判断行间移动方向并计算对应代价
        if (r2 >= r1) {
            for (int i = r1 + 1; i <= r2; i++) {
                res += rowCosts[i];
            }
        } else {
            for (int i = r2; i < r1; i++) {
                res += rowCosts[i];
            }
        }
        
        // 移动至家所在位置,判断列间移动方向并计算对应代价
        if (c2 >= c1) {
            for (int i = c1 + 1; i <= c2; i++) {
                res += colCosts[i];
            }
        } else {
            for (int i = c2; i < c1; i++) {
                res += colCosts[i];
            }
        }
        
        return res;
    }
}

###C#

public class Solution {
    public int MinCost(int[] startPos, int[] homePos, int[] rowCosts, int[] colCosts) {
        int r1 = startPos[0], c1 = startPos[1];
        int r2 = homePos[0], c2 = homePos[1];
        int res = 0;   // 总代价
        
        // 移动至家所在行,判断行间移动方向并计算对应代价
        if (r2 >= r1) {
            for (int i = r1 + 1; i <= r2; i++) {
                res += rowCosts[i];
            }
        } else {
            for (int i = r2; i < r1; i++) {
                res += rowCosts[i];
            }
        }
        
        // 移动至家所在位置,判断列间移动方向并计算对应代价
        if (c2 >= c1) {
            for (int i = c1 + 1; i <= c2; i++) {
                res += colCosts[i];
            }
        } else {
            for (int i = c2; i < c1; i++) {
                res += colCosts[i];
            }
        }
        
        return res;
    }
}

###Go

func minCost(startPos []int, homePos []int, rowCosts []int, colCosts []int) int {
    r1, c1 := startPos[0], startPos[1]
    r2, c2 := homePos[0], homePos[1]
    res := 0 // 总代价
    
    // 移动至家所在行,判断行间移动方向并计算对应代价
    if r2 >= r1 {
        for i := r1 + 1; i <= r2; i++ {
            res += rowCosts[i]
        }
    } else {
        for i := r2; i < r1; i++ {
            res += rowCosts[i]
        }
    }
    
    // 移动至家所在位置,判断列间移动方向并计算对应代价
    if c2 >= c1 {
        for i := c1 + 1; i <= c2; i++ {
            res += colCosts[i]
        }
    } else {
        for i := c2; i < c1; i++ {
            res += colCosts[i]
        }
    }
    
    return res
}

###C

int minCost(int* startPos, int startPosSize, int* homePos, int homePosSize, 
            int* rowCosts, int rowCostsSize, int* colCosts, int colCostsSize) {
    int r1 = startPos[0], c1 = startPos[1];
    int r2 = homePos[0], c2 = homePos[1];
    int res = 0;   // 总代价
    
    // 移动至家所在行,判断行间移动方向并计算对应代价
    if (r2 >= r1) {
        for (int i = r1 + 1; i <= r2; i++) {
            res += rowCosts[i];
        }
    } else {
        for (int i = r2; i < r1; i++) {
            res += rowCosts[i];
        }
    }
    
    // 移动至家所在位置,判断列间移动方向并计算对应代价
    if (c2 >= c1) {
        for (int i = c1 + 1; i <= c2; i++) {
            res += colCosts[i];
        }
    } else {
        for (int i = c2; i < c1; i++) {
            res += colCosts[i];
        }
    }
    
    return res;
}

###JavaScript

var minCost = function(startPos, homePos, rowCosts, colCosts) {
    const r1 = startPos[0], c1 = startPos[1];
    const r2 = homePos[0], c2 = homePos[1];
    let res = 0;   // 总代价
    
    // 移动至家所在行,判断行间移动方向并计算对应代价
    if (r2 >= r1) {
        for (let i = r1 + 1; i <= r2; i++) {
            res += rowCosts[i];
        }
    } else {
        for (let i = r2; i < r1; i++) {
            res += rowCosts[i];
        }
    }
    
    // 移动至家所在位置,判断列间移动方向并计算对应代价
    if (c2 >= c1) {
        for (let i = c1 + 1; i <= c2; i++) {
            res += colCosts[i];
        }
    } else {
        for (let i = c2; i < c1; i++) {
            res += colCosts[i];
        }
    }
    
    return res;
};

###TypeScript

function minCost(startPos: number[], homePos: number[], rowCosts: number[], colCosts: number[]): number {
    const r1 = startPos[0], c1 = startPos[1];
    const r2 = homePos[0], c2 = homePos[1];
    let res = 0;   // 总代价
    
    // 移动至家所在行,判断行间移动方向并计算对应代价
    if (r2 >= r1) {
        for (let i = r1 + 1; i <= r2; i++) {
            res += rowCosts[i];
        }
    } else {
        for (let i = r2; i < r1; i++) {
            res += rowCosts[i];
        }
    }
    
    // 移动至家所在位置,判断列间移动方向并计算对应代价
    if (c2 >= c1) {
        for (let i = c1 + 1; i <= c2; i++) {
            res += colCosts[i];
        }
    } else {
        for (let i = c2; i < c1; i++) {
            res += colCosts[i];
        }
    }
    
    return res;
}

###Rust

impl Solution {
    pub fn min_cost(start_pos: Vec<i32>, home_pos: Vec<i32>, row_costs: Vec<i32>, col_costs: Vec<i32>) -> i32 {
        let r1 = start_pos[0] as usize;
        let c1 = start_pos[1] as usize;
        let r2 = home_pos[0] as usize;
        let c2 = home_pos[1] as usize;
        let mut res = 0;   // 总代价
        
        // 移动至家所在行,判断行间移动方向并计算对应代价
        if r2 >= r1 {
            for i in (r1 + 1)..=r2 {
                res += row_costs[i];
            }
        } else {
            for i in r2..r1 {
                res += row_costs[i];
            }
        }
        
        // 移动至家所在位置,判断列间移动方向并计算对应代价
        if c2 >= c1 {
            for i in (c1 + 1)..=c2 {
                res += col_costs[i];
            }
        } else {
            for i in c2..c1 {
                res += col_costs[i];
            }
        }
        
        res
    }
}

复杂度分析

  • 时间复杂度:$O(m + n)$,其中 $m$ 为网格图的行数,$n$ 为网格图的列数。即为计算最小代价的时间复杂度。

  • 空间复杂度:$O(1)$。

前端基础项目:Drumkit,敲击乐实现路径

作者 YAwu11
2026年4月4日 17:08

Drumkit 是一个面向前端初学者的交互式项目,核心功能是通过键盘按键触发对应鼓垫单元的视觉反馈。该项目不涉及音频播放,专注于 DOM 操作与 CSS 交互的完整链路。以下从 HTML 结构、CSS 样式、JavaScript 逻辑三个层面解析其实现路径。

一、HTML 速写与 Emmet 简写

HTML 代码构建了页面的内容骨架。八个鼓垫单元分别对应键盘上的 A、D、C、B、T、R、G、M 键。

代码片段 1:鼓垫单元的结构

<div class="word" data-key="65">
    <h1>A</h1>
    <span class="sound">tele</span>
</div>

每个鼓垫单元使用 div 元素承载,类名为 word。自定义属性 data-key 存储对应按键的键码值,键码 65 代表字母 A,68 代表 D,67 代表 C,以此类推。该属性建立了键盘按键与 DOM 元素之间的映射关系,为 JavaScript 提供查找依据。

在编写多个结构相似的鼓垫单元时,Emmet 简写技术可以显著提升效率。输入 div.word[data-key]>h1+span.sound 并按下展开键,编辑器自动生成完整的 HTML 结构。开发者仅需修改 data-key 属性值与内部文本内容即可完成所有单元。

代码片段 2:脚本与样式的引入位置

<link rel="stylesheet" href="./drumkit.css" />
<!-- 页面内容 -->
<script src="./script.js"></script>

CSS 文件通过 <link> 标签放置在 head 中,确保样式在页面渲染前加载。JavaScript 文件通过 <script> 标签放置在 body 结束标签之前,这一位置选择与脚本执行机制直接相关。

二、CSS 基础内容:布局与交互样式

CSS 代码完成页面视觉表现与交互反馈样式的定义。以下从重置样式、布局系统、视觉美化、交互反馈四个维度分析。

代码片段 3:全局重置与视口高度

*{
    margin:0;
    padding:0;
}
body,html{
    height:100%;
}

通配符选择器 * 将所有元素的 marginpadding 归零,消除浏览器默认边距差异。htmlbody 高度设置为 100%,为后续 Flex 布局提供高度参照。

代码片段 4:Flex 布局实现居中

.all{
    display:flex;
    min-height: 100vh; 
    align-items:center;
    justify-content:center;
}

.all 容器作为父元素,通过 display: flex 开启弹性盒模型。min-height: 100vh 使容器最小高度占满整个视口。align-items: center 控制子元素在交叉轴(垂直方向)居中,justify-content: center 控制子元素在主轴(水平方向)居中。四个属性共同实现了所有鼓垫单元的视口中央排列。

代码片段 5:鼓垫单元的基础样式

.word{
    border:.4rem solid black;
    margin:1rem;
    width:10rem;
    background:rgba(0,0,0,0.4);
    text-shadow:0 0 .5rem black;
}

.word 类定义了鼓垫单元的固定宽度 10rem、黑色边框以及半透明黑色背景。rem 单位相对于根元素 html 的字体大小,根元素已设置为 10px,因此 1rem 等于 10pxrgba(0,0,0,0.4) 表示黑色通道值为 0,透明度为 0.4,实现半透明效果。

代码片段 6:交互反馈样式

.playing{
    transform: scale(1.5);
    box-shadow:0 0 1rem #ffc009;
    border-color:#ffc009;
}

.playing 类定义了按键触发时的视觉反馈。transform: scale(1.5) 将元素放大至原尺寸的 1.5 倍。box-shadow 生成向外扩散的亮黄色阴影,border-color 将边框颜色改为 #ffc009。当该类被添加到 .word 元素时,放大与高亮效果同时生效。

CSS 代码中的错误提示.key sound 选择器不会匹配任何元素,因为 HTML 中不存在类名为 key 的元素。正确选择器应为 .word .sound

三、JavaScript 脚本存放与 DOM 编程

JavaScript 代码实现键盘事件监听与 DOM 元素操作。以下从脚本存放位置、事件绑定、动态查询、类名操作四个层面解析。

代码片段 7:脚本存放位置与 DOMContentLoaded 事件

document.addEventListener('DOMContentLoaded',function(){
    // 核心逻辑
});

脚本文件放置在 body 结束标签之前,但代码中仍使用了 DOMContentLoaded 事件。该事件在初始 HTML 文档完全加载和解析后触发,无需等待样式表与图片。双重保障确保 DOM 元素可被安全查询。

代码片段 8:事件处理函数的结构

function playSound(event){
    console.log(event.keyCode,'////////////');
    let dataCode = event.keyCode;
    let element = document.querySelector('.word[data-key="'+dataCode+'"]');
    console.log(element); 
    element.classList.add('playing');
}

playSound 函数接收键盘事件对象 event 作为参数。event.keyCode 属性返回被按下按键的键码值,控制台输出用于调试验证。

动态 DOM 编程的核心体现在 document.querySelector 方法。该方法接受 CSS 选择器字符串,返回匹配的第一个元素。此处使用属性选择器 '.word[data-key="' + dataCode + '"]',通过字符串拼接将键码值嵌入选择器。当按下 A 键时,dataCode65,生成的选择器为 '.word[data-key="65"]',精确匹配对应的鼓垫单元。

代码片段 9:键盘事件绑定

window.addEventListener('keydown',playSound);

window.addEventListenerkeydown 事件与 playSound 处理函数绑定到全局窗口对象。任何键盘按键被按下时,playSound 函数均被调用,通过键码匹配决定是否触发视觉反馈。

查找到目标元素后,classList.add('playing') 为元素添加 playing 类。classList 是 DOM 元素提供的类名操作接口,add 方法向类列表中添加新类。添加完成后,CSS 中预定义的放大与阴影样式立即生效。

JavaScript 代码的潜在问题:当按下未在 data-key 中定义的按键时,document.querySelector 返回 null,后续调用 classList.add 会抛出错误。实际开发中应增加条件判断:if (element) { element.classList.add('playing'); }

四、核心学习内容总结

Drumkit 项目集中训练了五项前端基础能力,其核心链路与知识点占整体内容的 70% 以上。

Emmet 简写:通过 div.word[data-key]>h1+span.sound 类表达式快速生成重复 HTML 结构,减少手动编码时间。

HTML 速写:自定义属性 data-key 的命名与赋值,属性选择器 [data-key="value"] 的语法规则,以及脚本与样式文件的引入位置规范。

CSS 基础内容:通配符选择器重置样式、Flex 布局的四个核心属性(displaymin-heightalign-itemsjustify-content)、remvh 视口单位、rgba() 半透明背景、transform: scale() 变换、box-shadow 阴影效果、类名切换驱动样式变化的交互模式。

JavaScript 脚本存放<script> 标签放置在 body 末尾的原因(避免阻塞 DOM 构建)、DOMContentLoaded 事件的作用与用法。

JavaScript DOM 编程document.querySelector 动态查询元素、属性选择器的字符串拼接、classList.add 操作类名、window.addEventListener 绑定键盘事件、事件对象 event.keyCode 属性的读取。

该项目的完整交互链路为:用户按键 → 触发 keydown 事件 → 读取 event.keyCode → 拼接属性选择器 → 调用 querySelector 查找元素 → 调用 classList.add 添加类名 → CSS 渲染放大与高亮样式。这一链路覆盖了前端事件处理与 DOM 操作的核心流程,是学习组件化开发与框架交互的基础原型。

假期首日国铁集团郑州局预计发送旅客98.6万人次

2026年4月4日 16:57
36氪获悉,中国铁路郑州局集团有限公司消息,清明假期第一天(4月4日),国铁集团郑州局迎来出行高峰,管内各大车站客流高位运行,预计发送旅客98.6万人次,较2025年同期增长5.7%,计划增开临客列车80列,其中向北京、上海等重点方向开行夜间高铁21列,保障旅客有序出行。

跨越边界的艺术:现代 Web 开发跨域解决方案终极指南

作者 有意义
2026年4月4日 16:46

一、跨域的本质:同源策略是什么?

想要解决跨域问题,首先要明白“跨域”从何而来。

1. 同源策略的定义

浏览器的同源策略(Same-Origin Policy) 是跨域的核心根源,它是浏览器最核心也最基本的安全功能。
所谓“同源”,要求两个页面的以下三点必须完全相同:

  • 协议(http/https)
  • 域名(包括主域名、子域名)
  • 端口号(80/443/3000等)

image.png 只要三者有其一不同,就会被判定为“跨域”。此时,浏览器会限制非同源页面的以下行为:

  • 读取非同源网页的 Cookie、LocalStorage、IndexedDB 等存储数据。
  • 获取非同源网页的 DOM 元素。
  • 向非同源地址发送 AJAX 请求(XMLHttpRequest/fetch)。

2. 为什么需要同源策略?

同源策略就像一道“防火墙”,从根本上限制了恶意网站的非法操作,保障了用户的信息安全。试想一下,如果没有同源策略:

  • 恶意网站可以轻易读取你网银页面的 Cookie,盗取账户信息。
  • 钓鱼网站可以嵌入真实的电商页面,篡改支付金额。
  • 任意网站都能向你的服务器发送伪造请求,发起 CSRF 攻击。

3. 跨域的常见场景

日常开发中,跨域几乎无处不在:

  • 前后端分离项目:前端运行在 localhost:5173,后端接口在 localhost:3000(端口不同)。
  • 调用第三方接口:如支付、地图、天气等第三方服务(域名不同)。
  • 多端协作:公司内部不同部门的系统对接(子域名不同)。

二、方案 1:JSONP——兼容性拉满的“老古董”

JSONP(JSON with Padding)是跨域方案中的“老前辈”,也是早期前端解决跨域最常用的方式,最大的优势是浏览器兼容性极好(甚至能兼容 IE6/7)。

1. JSONP 的核心原理

浏览器的同源策略限制了 AJAX 请求,但并没有限制 <script> 标签的 src 属性。<script> 可以加载任意域名的资源(比如 CDN 上的 jQuery)。
JSONP 正是利用这一“漏洞”实现跨域:

  • 前端动态创建 <script> 标签,通过 src 向跨域接口发送请求,同时传递一个回调函数名。
  • 后端接收到请求后,将数据包裹在回调函数中返回(即“JSON with Padding”)。
  • 前端的回调函数被执行,从而拿到跨域数据。

2. JSONP 实战实现

前端代码(封装 JSONP 函数)
这段代码封装了一个返回 Promise 的 JSONP 函数,便于处理异步逻辑:

// 封装JSONP请求函数,返回Promise方便异步处理
function jsonp({ url, params, callback }) {
  return new Promise((resolve, reject) => {
    // 1. 创建script标签
    let script = document.createElement('script')
    // 2. 定义全局回调函数,接收后端返回的数据
    window[callback] = function(data) {
      resolve(data) // 成功拿到数据,resolve Promise
      document.body.removeChild(script) // 移除script标签,避免污染
    }
    // 3. 拼接请求参数(包含回调函数名)
    params = { ...params, callback } // 比如:{wd: 'test', callback: 'show'}
    let arrs = []
    for (let key in params) {
      arrs.push(`${key}=${params[key]}`)
    }
    // 4. 设置script的src属性,发送请求
    script.src = `${url}?${arrs.join('&')}`
    document.body.appendChild(script)
    // 5. 处理请求失败场景
    script.onerror = function() {
      reject(new Error('JSONP请求失败'))
      document.body.removeChild(script)
    }
  })
}

// 调用JSONP请求
jsonp({
  url: 'http://localhost:3000/say',
  params: { wd: 'Iloveyou' },
  callback: 'show'
}).then(data => {
  console.log('JSONP请求结果:', data)
}).catch(err => {
  console.error(err)
})

后端代码(Node.js 原生实现)
后端需要接收回调函数名,并将数据包裹在函数调用中返回:

const http = require('http');
const server = http.createServer((req, res) => {
  // 匹配/say接口
  if (req.url.startsWith('/say')) {
    // 解析URL参数
    const url = new URL(req.url, `http://${req.headers.host}`);
    const callback = url.searchParams.get('callback'); // 获取回调函数名
    
    // 设置响应头:返回JS脚本
    res.writeHead(200, { 'Content-type': 'text/javascript' });
    // 构造返回数据,包裹在回调函数中
    const data = {
      id: 1,
      username: 'admin',
      msg: 'JSONP请求成功'
    }
    // 核心:返回 "回调函数(数据)" 格式的JS代码
    res.end(`${callback}(${JSON.stringify(data)})`);
  } else {
    res.writeHead(404);
    res.end('Not Found')
  }
})

server.listen(3000, () => {
  console.log('JSONP服务器运行在 http://localhost:3000');
})

3. JSONP 的优缺点

表格

维度 详细说明
✅ 优点 兼容性极强:支持所有主流浏览器,包括低版本 IE。 实现简单:无需复杂的配置,前端后端少量代码即可完成。
❌ 缺点 仅支持 GET 请求:因为 <script> 标签的 src 只能发起 GET 请求。 安全风险:容易遭受 XSS 攻击(加载的脚本可能包含恶意代码),需确保请求的服务器是可信的。 性能问题:额外加载的 <script> 标签会阻塞页面渲染,影响首屏加载速度。

4. 适用场景

仅推荐在兼容老旧浏览器(如需要支持 IE6/7)的场景下使用。在现代项目中,优先选择其他方案。

三、方案 2:CORS——现代跨域的主流之选

CORS(跨域资源共享,Cross-Origin Resource Sharing)是W3C制定的标准,也是目前解决跨域问题最主流、最推荐的方式。它本质上是在HTTP协议之上,通过增加特定的请求头和响应头,让浏览器和服务器协同工作,来判断一个跨域请求是否被允许。

1. CORS 的核心原理

CORS 的核心思想是:将跨域的控制权从浏览器完全转移到服务器。

1. 浏览器发起请求:当浏览器发起一个跨域请求时,它会自动在请求头中添加 Origin 字段,标明请求的来源(协议、域名、端口)。

2. 服务器决策:服务器接收到请求后,根据 Origin 字段的值来判断是否允许这个来源的请求。

3. 服务器响应:如果服务器允许该请求,它会在响应头中添加 Access-Control-Allow-Origin 字段,其值就是被允许的源。

4. 浏览器检查:浏览器收到响应后,会检查响应头中的 Access-Control-Allow-Origin 是否与请求的 Origin 匹配。如果匹配,则将响应数据返回给前端JS代码;如果不匹配,则浏览器会拦截响应,并在控制台抛出跨域错误。

2. 简单请求 vs 预检请求

CORS 将跨域请求分为两类:简单请求预检请求

简单请求 一个请求要成为简单请求,必须同时满足以下条件:

请求方法是以下之一:GET, HEAD, POST

自定义请求头:除了浏览器自动设置的 Accept, Accept-Language, Content-Language, Content-Type 等,没有添加其他自定义请求头。

Content-Type 的值仅限于:application/x-www-form-urlencoded, multipart/form-data, text/plain

对于简单请求,浏览器会直接发送,并在请求头中带上 Origin

预检请求 不满足简单请求条件的,就是预检请求。例如,使用 PUTDELETE 方法,或者 Content-Typeapplication/json,又或者添加了自定义请求头(如 token)。

对于预检请求,浏览器会先自动发起一个 OPTIONS 方法的请求(这就是“预检”),询问服务器是否允许当前的跨域请求。只有在服务器明确回复“允许”后,浏览器才会真正发起后续的请求。

3. CORS 实战实现

后端代码(Node.js + Express) 使用 Express 框架时,可以借助 cors 中间件轻松实现 CORS。

const express = require('express');
const cors = require('cors'); // 引入cors中间件
const app = express();

// 1. 允许所有来源的跨域请求 (最宽松的配置)
app.use(cors());

// 2. 或者,进行更精细的配置
const corsOptions = {
  origin: 'http://localhost:5173', // 只允许这个源访问
  methods: ['GET', 'POST', 'PUT'], // 允许的请求方法
  allowedHeaders: ['Content-Type', 'Authorization'], // 允许的自定义请求头
  credentials: true // 允许携带Cookie等凭证
};
app.use(cors(corsOptions));

// 定义一个需要跨域访问的接口
app.get('/api/data', (req, res) => {
  res.json({ message: 'CORS请求成功!', data: [1, 2, 3] });
});

app.listen(3000, () => {
  console.log('CORS服务器运行在 http://localhost:3000');
});

后端代码(Node.js 原生实现) 如果不使用框架,也可以手动设置响应头。

const http = require('http');
const server = http.createServer((req, res) => {
  // 设置允许跨域的源,* 表示允许所有源
  res.setHeader('Access-Control-Allow-Origin', '*');
  // 允许的请求方法
  res.setHeader('Access-Control-Allow-Methods', 'GET, POST, PUT, DELETE');
  // 允许的自定义请求头
  res.setHeader('Access-Control-Allow-Headers', 'Content-Type, Authorization');
  // 允许携带凭证(如Cookie)
  res.setHeader('Access-Control-Allow-Credentials', 'true');

  // 处理预检请求
  if (req.method === 'OPTIONS') {
    res.writeHead(204); // 204 No Content
    res.end();
    return;
  }

  // 处理其他业务请求
  if (req.url === '/api/data') {
    res.writeHead(200, { 'Content-Type': 'application/json' });
    res.end(JSON.stringify({ message: 'CORS请求成功!', data: [1, 2, 3] }));
  }
});

server.listen(3000, () => {
  console.log('CORS服务器运行在 http://localhost:3000');
});

4. 关键的 CORS 响应头

响应头 说明
Access-Control-Allow-Origin 必需。指定允许访问的源,可以是 *(通配符)或具体的源(如 http://example.com)。
Access-Control-Allow-Methods 预检请求必需。指定允许的请求方法,如 GET, POST, PUT
Access-Control-Allow-Headers 预检请求必需。指定允许的自定义请求头,如 Content-Type, Authorization
Access-Control-Allow-Credentials 可选。一个布尔值,表示是否允许浏览器发送 Cookie。如果为 true,则 Access-Control-Allow-Origin 不能为 *,必须是具体的源。
Access-Control-Max-Age 可选。指定预检请求的缓存时间(秒),避免频繁发送 OPTIONS 请求。

5. CORS 的优缺点

维度 详细说明
优点 功能强大:支持所有类型的 HTTP 请求(GET, POST, PUT, DELETE 等)。安全性高:通过服务器精确控制允许的源、方法和请求头。现代标准:被所有现代浏览器支持,是前后端分离项目的最佳实践。
缺点 需要后端配合:必须在服务器端进行配置,前端无法单方面解决。配置复杂:对于需要携带凭证或复杂请求头的场景,配置相对繁琐。兼容性问题:不支持 IE9 及以下版本。

6. 适用场景

CORS 是现代 Web 开发中解决跨域问题的首选方案,尤其适用于前后端分离的架构。只要后端能够配合修改响应头,就应该优先使用 CORS。

四、方案 3:反向代理——“曲线救国”的万能钥匙

反向代理是开发环境中解决跨域问题最常用、也最省心的方法之一。它的核心思想是 “曲线救国” :既然浏览器禁止前端直接访问后端接口,那我们就让前端请求一个和自己“同源”的代理服务器,再由这个代理服务器去请求真正的后端接口。

1. 反向代理的核心原理

1.  前端请求代理:前端应用(如运行在 localhost:5173)不再直接请求后端接口(如 localhost:3000/api),而是请求一个与自己同源的代理地址(如 localhost:5173/api)。因为源相同,所以不会触发浏览器的跨域限制。

2.  代理服务器转发:这个代理服务器(通常是开发服务器或 Nginx)收到请求后,会以自己的身份向真正的后端接口(localhost:3000/api)发起请求。这个请求是服务器与服务器之间的通信,不受浏览器同源策略的限制。

3. 代理服务器返回:代理服务器拿到后端接口的响应数据后,再原封不动地返回给前端。 通过这种方式,前端巧妙地绕过了浏览器的跨域限制,实现了数据的获取。

2. 反向代理实战实现

反向代理的实现方式多种多样,从开发环境的配置到生产环境的部署,都有其身影。

开发环境:Vite/Webpack 配置 在现代前端框架(如 Vue, React)的开发环境中,我们通常使用 Vite 或 Webpack 作为开发服务器。它们都内置了强大的代理功能,只需几行配置即可解决跨域问题。

Vite 配置示例 ( vite.config.js )

import { defineConfig } from 'vite'
import vue from '@vitejs/plugin-vue'

export default defineConfig({
  plugins: [vue()],
  server: {
    // 配置代理规则
    proxy: {
      // 当前端请求 /api 路径时,触发代理
      '/api': {
        target: 'http://localhost:3000', // 代理的目标服务器地址
        changeOrigin: true, // 修改请求头中的 Origin 为目标服务器的 Origin
        // rewrite: (path) => path.replace(/^/api/, '') // 可选:重写路径,去掉 /api 前缀
      }
    }
  }
})

配置完成后,前端请求 http://localhost:5173/api/data,开发服务器会自动将其转发到 http://localhost:3000/api/data

生产环境:Nginx 配置 在项目部署到生产环境时,Nginx 是最常用的反向代理服务器。它不仅能处理跨域,还能提供负载均衡、静态资源服务、缓存等多种功能。

Nginx 配置示例 ( nginx.conf )

server {
    listen       80;
    server_name  localhost; # 或者你的域名

    # 1. 配置前端静态文件
    location / {
        root   /usr/share/nginx/html; # 前端打包文件的路径
        index  index.html index.htm;
        try_files $uri $uri/ /index.html; # 解决前端路由 history 模式刷新404的问题
    }

    # 2. 配置后端接口代理
    location /api/ {
        proxy_pass http://backend_server:3000/; # 后端服务器的地址
        proxy_set_header Host $host;             # 传递原始主机头
        proxy_set_header X-Real-IP $remote_addr; # 传递用户真实IP
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    }
}

这样配置后,无论是前端页面还是 /api/ 开头的接口请求,都由同一个 Nginx 服务器处理,完美规避了跨域问题。

3. 反向代理的优缺点

维度 详细说明
优点 前端无感:前端代码无需任何修改,完全不用关心跨域问题。功能强大:除了跨域,还能实现负载均衡、请求/响应拦截、日志记录等。通用性强:适用于任何类型的请求,不受请求方法和请求头的限制。
缺点 增加服务器成本:需要额外部署和维护一台代理服务器(如 Nginx)。配置相对复杂:相比 CORS,反向代理的配置(尤其是 Nginx)需要一定的运维知识。可能增加延迟:请求多了一次转发,理论上会增加一点点网络延迟。

4. 适用场景

● 开发环境:强烈推荐使用 Vite/Webpack 的代理功能,是开发阶段解决跨域问题的首选。

● 生产环境:当你无法控制后端服务器(例如调用第三方API),或者后端团队不方便配合配置 CORS 时,使用 Nginx 反向代理是最佳选择。它也是微服务架构中 API 网关的雏形。

五、方案 4:WebSocket——实时通信的“特权通道”

WebSocket 是一种在单个 TCP 连接上进行全双工通信的协议。它最大的特点是不受同源策略的限制,这使得它在需要实时双向通信的场景下,成为了一个天然的跨域解决方案。

1. WebSocket 的核心原理

WebSocket 的工作流程可以分为三个阶段:

1. 握手阶段:前端通过 JavaScript 创建一个 WebSocket 对象,浏览器会向服务器发起一个特殊的 HTTP 请求。这个请求头中包含 Upgrade: websocket 字段,表示希望将协议从 HTTP 升级到 WebSocket。

2. 协议升级:服务器收到请求后,如果支持 WebSocket,会返回一个状态码为 101 (Switching Protocols) 的响应,同意协议升级。

3. 数据传输:一旦握手成功,客户端和服务器之间就建立了一条持久的 TCP 连接。此后,双方可以随时主动向对方推送数据,而无需像 HTTP 那样由客户端反复发起请求。

正是因为 WebSocket 在握手成功后就脱离了 HTTP 协议的范畴,建立了一条独立的“管道”,所以浏览器不会对其应用同源策略的限制。

2. WebSocket 实战实现

前端代码 前端使用非常简单,只需几行代码即可建立连接并监听事件。

// 1. 创建 WebSocket 连接,传入服务器地址
// 注意:协议是 ws:// (或 wss:// 用于加密连接)
const socket = new WebSocket('ws://localhost:3000');

// 2. 监听连接成功事件
socket.onopen = function(event) {
  console.log('WebSocket 连接已建立');
  // 连接成功后,可以立即向服务器发送数据
  socket.send(JSON.stringify({ type: 'init', data: 'Hello Server!' }));
};

// 3. 监听服务器发来的消息
socket.onmessage = function(event) {
  console.log('收到服务器消息:', event.data);
  const data = JSON.parse(event.data);
  // 根据消息类型处理数据
  if (data.type === 'notification') {
    alert(data.message);
  }
};

// 4. 监听连接关闭事件
socket.onclose = function(event) {
  console.log('WebSocket 连接已关闭');
};

// 5. 监听连接错误事件
socket.onerror = function(event) {
  console.error('WebSocket 发生错误:', event);
};

// 随时可以向服务器发送数据
function sendMsg() {
  socket.send('这是一条新消息');
}

后端代码(Node.js + ws 库) 后端可以使用 ws 这个轻量级的 WebSocket 库来快速搭建服务器。

const WebSocket = require('ws');

// 创建一个 WebSocket 服务器,监听 3000 端口
const wss = new WebSocket.Server({ port: 3000 });

// 监听客户端连接事件
wss.on('connection', (ws) => {
  console.log('有客户端连接进来了');

  // 向当前连接的客户端发送欢迎消息
  ws.send(JSON.stringify({ type: 'welcome', message: '欢迎连接到 WebSocket 服务器' }));

  // 监听当前客户端发来的消息
  ws.on('message', (data) => {
    console.log('收到客户端消息:', data.toString());
    // 可以将消息广播给所有连接的客户端
    wss.clients.forEach((client) => {
      if (client.readyState === WebSocket.OPEN) {
        client.send(`广播: ${data}`);
      }
    });
  });

  // 监听客户端断开连接
  ws.on('close', () => {
    console.log('客户端连接已关闭');
  });
});

console.log('WebSocket 服务器运行在 ws://localhost:3000');

3. WebSocket 的优缺点

维度 详细说明
优点 天然跨域:不受同源策略限制,无需额外配置。实时双向通信:服务器可以主动向客户端推送数据,延迟极低。持久连接:只需一次握手,即可保持长时间通信,减少了 HTTP 反复建立连接的开销。
缺点 协议不同:需要服务器和客户端都支持 WebSocket 协议,不适用于传统的 HTTP 请求场景。兼容性问题:不支持 IE9 及以下版本。连接管理复杂:需要处理连接的建立、维持、断开和重连,比简单的 HTTP 请求更复杂。

4. 适用场景

WebSocket 专为实时性要求高的场景而生,例如:

● 在线聊天/即时通讯:如微信网页版、在线客服。

● 实时数据推送:如股票行情、体育比赛比分、新闻快讯。

● 协同编辑:如在线文档、代码编辑器。

● 多人在线游戏:需要实时同步玩家状态。


六、方案 5:Vite 反向代理 —— 本地开发的 “最优解”

在前端本地开发阶段,我们经常会遇到这样的场景:前端项目运行在 http://localhost:5173,而后端接口运行在 http://localhost:3000。虽然这只是开发环境下的端口不同,但在浏览器看来这就是“跨域”。

虽然可以通过后端配置 CORS 来解决,但在开发阶段,更优雅、更安全的方式是利用开发服务器(如 Vite、Webpack)进行反向代理。这种方式不需要后端做任何改动,完全由前端工具链来处理跨域问题。

1. Vite 代理的核心原理

Vite 代理的本质是利用了开发服务器(Dev Server)作为“中间人”。

  • 前端视角:前端代码发起请求时,目标地址是 Vite 服务器(例如 /api/user)。
  • 同源策略豁免:因为 Vite 服务器就是提供前端页面的服务端,所以前端请求 /api/user 属于“同源请求”,浏览器不会拦截。
  • 服务器转发:Vite 服务器接收到请求后,发现这是一个代理请求,于是它会以“服务器身份”向真正的后端接口(例如 http://localhost:3000/api/user)发起请求。
  • 响应返回:后端接口将数据返回给 Vite 服务器,Vite 再将数据返回给前端浏览器。

关键点:浏览器与 Vite 服务器之间是同源的(无跨域);Vite 服务器与后端服务器之间是服务器间的通信(不受浏览器同源策略限制)。通过这种“曲线救国”的方式,完美绕过了浏览器的跨域限制。

2. Vite 代理实战配置

Vite 内置了强大的代理功能,基于 http-proxy 中间件实现。我们只需要在 vite.config.js 中进行简单的配置即可。

配置步骤:

  1. 打开项目根目录下的 vite.config.js 文件。
  2. 在 server 选项中添加 proxy 配置。
  3. 定义需要代理的路径前缀(如 /api)。
// vite.config.js
import { defineConfig } from 'vite'
import vue from '@vitejs/plugin-vue'

export default defineConfig({
  plugins: [vue()],
  server: {
    // 配置代理规则
    proxy: {
      // 1. 定义代理前缀
      // 当请求路径以 '/api' 开头时,触发代理
      '/api': {
        // 2. 目标服务器地址
        // 这里填写后端接口的真实地址
        target: 'http://localhost:3000',
        
        // 3. 是否改变请求头中的 Origin
        // 设置为 true 时,Vite 会将请求头的 Host 改为目标服务器的 Host
        // 避免后端因为 Origin 校验不通过而拒绝请求
        changeOrigin: true,
        
        // 4. 路径重写 (可选)
        // 如果后端不需要 '/api' 这个前缀,可以将其重写为空
        // 例如:前端请求 '/api/user' -> 后端接收 '/user'
        rewrite: (path) => path.replace(/^/api/, '')
      },
      
      // 5. 多个代理配置 (可选)
      // 如果有多个不同的后端服务,可以继续添加
      '/upload': {
        target: 'http://upload-server.com',
        changeOrigin: true
      }
    }
  }
})

3. 配置项详解

表格

配置项 类型 说明
target String 必需。你要代理到的目标地址,即后端接口的真实域名或 IP。
changeOrigin Boolean 推荐开启。设为 true 时,会自动修改请求头中的 host 为 target 的值。很多后端框架(如 Nginx、Java Spring)会校验 host,不开启可能导致 403/404 错误。
rewrite Function 可选。用于重写请求路径。例如,如果后端接口不需要前端定义的前缀(如 /api),可以用此函数将其替换或删除。
secure Boolean 如果目标是 https 接口,设为 false 可以忽略 HTTPS 证书校验(开发环境常用)。

4. 优缺点分析

优点:

  • 开发环境专用神器:无需后端配合,前端开发者自己就能搞定,不影响生产环境配置。
  • 无跨域风险:完全在开发服务器层面处理,浏览器根本感知不到跨域的存在。
  • 配置极其简单:Vite 内置功能,几行代码即可完成,且支持 TypeScript 配置。
  • 支持 WebSocket:Vite 代理也支持代理 WebSocket 连接(配置 ws: true)。

缺点:

  • 仅限开发环境:Vite 代理只在 vite dev 启动的开发服务器中生效。项目打包上线后,Vite 服务器不再运行,代理配置也随之失效。
  • 无法解决生产环境问题:它只是一个开发时的“模拟器”,不能用于解决线上环境的跨域问题。

5. 适用场景

  • 前端本地开发:这是该方案的唯一且最佳场景。
  • 接口联调阶段:在后端尚未部署或无法修改响应头时,前端通过代理快速进行联调。
  • Mock 数据切换:配合环境变量,可以在代理真实接口和本地 Mock 服务之间灵活切换。

八、方案 7:postMessage —— 跨域通信的“万能信使”

前文提到的 JSONP、CORS、反向代理等方案,主要解决的是“浏览器向服务器请求数据”的跨域问题。但在现代 Web 开发中,我们经常会遇到“页面与页面”、“窗口与窗口”之间需要通信的场景,例如:

  • 父页面与嵌入的跨域 iframe 进行数据交互。
  • 主窗口与通过 window.open() 打开的跨域子窗口同步状态。
  • 主线程与 Web Worker 之间传递消息。

对于这些场景,postMessage 是 HTML5 提供的标准解决方案,它就像一个“万能信使”,允许不同源的窗口之间安全地进行双向通信。

1. postMessage 的核心原理

postMessage 的核心思想是 “消息传递” 而非“直接访问”。它打破了浏览器的同源策略,但并没有完全移除安全限制。

  • 发送方:通过 targetWindow.postMessage(message, targetOrigin) 方法,向目标窗口发送一条结构化的数据消息。
  • 接收方:通过监听 window 对象的 message 事件,来捕获并处理来自其他窗口的消息。
  • 安全校验:整个过程通过 targetOrigin(发送时指定目标源)和 event.origin(接收时检查消息来源)进行双重安全校验,确保消息只在你信任的窗口之间传递。

2. postMessage 实战实现

我们以最常见的 父页面与跨域 iframe 通信 为例,展示如何实现双向通信。

父页面 (parent.html)

<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <title>父页面</title>
</head>
<body>
    <h1>我是父页面</h1>
    <!-- 嵌入一个跨域的 iframe -->
    <iframe id="childFrame" src="https://iframe-example.com/child.html"></iframe>

    <script>
        const iframe = document.getElementById('childFrame');

        // 1. 向 iframe 发送消息
        // 注意:必须等待 iframe 加载完成后再发送
        iframe.onload = () => {
            const data = { type: 'GREETING', text: 'Hello from parent!' };
            // 精确指定目标源,这是安全的关键!
            iframe.contentWindow.postMessage(data, 'https://iframe-example.com');
        };

        // 2. 监听来自 iframe 的消息
        window.addEventListener('message', (event) => {
            // 【安全红线】必须校验消息来源!
            if (event.origin !== 'https://iframe-example.com') {
                console.warn('收到来自非法源的消息,已忽略');
                return;
            }
            console.log('父页面收到消息:', event.data);
        });
    </script>
</body>
</html>

子页面 (child.html)

<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <title>子页面 (iframe)</title>
</head>
<body>
    <h1>我是子页面 (iframe)</h1>
    <script>
        // 1. 监听来自父页面的消息
        window.addEventListener('message', (event) => {
            // 【安全红线】同样必须校验消息来源!
            if (event.origin !== 'https://parent-example.com') {
                return;
            }
            console.log('子页面收到消息:', event.data);

            // 2. 向父页面回复消息
            const replyData = { type: 'REPLY', text: 'Hello back!' };
            // event.source 是发送消息的窗口对象的引用
            event.source.postMessage(replyData, event.origin);
        });
    </script>
</body>
</html>

3. API 详解

发送消息:targetWindow.postMessage(message, targetOrigin)

表格

参数 类型 说明
message 任意类型 要发送的数据。可以是字符串、对象、数组等,数据会被浏览器使用“结构化克隆算法”进行序列化。
targetOrigin String 安全关键!  指定接收消息的窗口的源(协议+域名+端口)。必须精确指定,严禁在生产环境使用通配符 '*' ,否则可能导致敏感数据泄露给恶意网站。

接收消息:window.addEventListener('message', callback)

回调函数接收一个 MessageEvent 对象,其中包含三个关键属性:

表格

属性 类型 说明
event.data 任意类型 发送方传递的实际消息数据。
event.origin String 安全关键!  发送消息的窗口的源。接收方必须校验此属性,确保消息来自可信源。
event.source Window 对象 发送消息的窗口对象的引用。可用于向发送方回传消息,实现双向通信。

4. 优缺点分析

优点:

  • 功能强大:解决了页面间通信的跨域问题,这是 CORS 和代理无法做到的。
  • 双向通信:支持父子窗口、主副窗口之间的双向消息传递。
  • 安全性高:通过 targetOrigin 和 event.origin 的双重校验,可以有效防止恶意攻击。
  • 数据灵活:支持传递复杂的结构化数据。

缺点:

  • 使用场景特定:仅适用于窗口间通信,不适用于常规的 AJAX 请求。
  • 安全要求高:开发者必须手动进行源校验,任何疏忽都可能导致严重的安全漏洞(如 XSS)。
  • 异步通信:基于事件模型,处理复杂交互时逻辑可能变得分散。

5. 适用场景

  • 第三方组件集成:如嵌入支付宝/微信支付的 iframe,支付完成后通知父页面。
  • 跨域单点登录(SSO) :通过一个中央登录页,使用 postMessage 将登录令牌传递给其他域名的应用。
  • 微前端架构:主应用与子应用之间进行状态同步和事件通知。
  • 多窗口协作:如在线协作文档,主窗口打开多个编辑窗口,并同步光标位置和编辑内容。
  • Web Worker:主线程与后台线程进行数据交换。

深入浅出PureMVC框架:从理论到Unity实战

作者 UnityMozh
2026年4月4日 16:22

一、PureMVC是什么?

一句话定义:PureMVC是一个轻量级的、基于经典MVC模式的应用程序框架,核心目标是将代码按职责分离,实现高内聚低耦合

PureMVC框架链接puremvc.org/ 找到对应的语言下载即可

二、为什么需要PureMVC?

没有框架的Unity项目长什么样?

csharp

// 典型“上帝类”写法 —— 所有逻辑堆在一个MonoBehaviour里
public class BattleManager : MonoBehaviour
{
    public UIManager ui;
    public NetworkManager network;
    public DataManager data;
    
    void OnEnemyDie()
    {
        ui.ShowVictoryPanel();
        data.AddExp(100);
        network.SendBattleResult();
        // 越往后越难维护...
    }
}

问题

  1. 代码耦合度高,改一个地方炸一片
  2. 新人不敢改老代码
  3. 单元测试几乎不可能写
  4. 多人协作时频繁冲突

三、PureMVC核心组件详解

1. Facade —— 统一入口(门面)

角色定位:整个框架的“前台总机”,所有对外操作都通过它。

(简单来说就是Mediator、Proxy、Command之间都不会互相调用,因为这样会非常的复杂,不便于维护,而是统一通过调用Facade里的类似GetProxy()、GetMediator()函数来间接获取目标引用,这样通过在Facade实现统一的接口来让外部调用的方法很好的解决了模块间直接引用导致的逻辑混乱)

csharp

// 标准用法:项目里写一个自己的Facade继承基类
public class GameFacade : Facade
{
    // 单例访问
    public static GameFacade Instance => instance as GameFacade;
    
    // 启动框架
    public void Startup()
    {
        // 注册Proxy
        RegisterProxy(new UserProxy());
        RegisterProxy(new BagProxy());
        
        // 注册Command(绑定事件与处理逻辑)
        RegisterCommand(NotificationName.LOGIN, () => new LoginCommand());
        RegisterCommand(NotificationName.BAG_ADD_ITEM, () => new AddItemCommand());
        
        // 注册Mediator(通常由UIManager在打开界面时动态注册)
    }
}

// 业务代码中调用
GameFacade.Instance.SendNotification(NotificationName.LOGIN, userData);

核心职责

  • 初始化Model、View、Controller三大核心模块
  • 注册/获取Proxy、Mediator、Command
  • 发送Notification

2. Proxy —— 数据与业务代理

角色定位:管理某一类数据,以及操作这些数据的方法。

csharp

// 数据代理:管理玩家背包
public class BagProxy : Proxy
{
    // Proxy名称(用于跨模块获取)
    public new const string NAME = "BagProxy";
    
    // 实际数据
    public List<Item> Items { get; private set; } = new List<Item>();
    
    // 业务方法
    public void AddItem(Item item)
    {
        Items.Add(item);
        // 数据变了,发通知告诉UI更新
        SendNotification(NotificationName.BAG_UPDATE, Items.Count);
    }
    
    public bool HasItem(int itemId)
    {
        return Items.Any(item => item.Id == itemId);
    }
    
    public void RemoveItem(int itemId)
    {
        Items.RemoveAll(item => item.Id == itemId);
        SendNotification(NotificationName.BAG_UPDATE);
    }
}

// 其他地方获取并使用
var bagProxy = GameFacade.Instance.RetrieveProxy(BagProxy.NAME) as BagProxy;
bagProxy.AddItem(new Item(10001, "红药水"));

关键理解

  • Proxy 只发Notification,不收Notification —— 这是PureMVC刻意设计,保证Model层独立,不依赖其他层
  • Proxy可以持有网络请求逻辑(但盛趣项目通常网络层单独封装,Proxy只负责调用)

3. Mediator —— 视图的中介

角色定位:UI界面和PureMVC系统之间的“翻译官”。

csharp

// 中介者:管理一个背包面板
public class BagMediator : Mediator
{
    public new const string NAME = "BagMediator";
    
    // 持有的UI组件引用
    private BagPanel bagPanel;
    
    // 构造函数:传入View组件
    public BagMediator(BagPanel panel) : base(NAME)
    {
        bagPanel = panel;
        bagPanel.OnItemClick += HandleItemClick; // 监听UI事件
    }
    
    // 声明感兴趣的通知(订阅)
    public override IList<string> ListNotificationInterests()
    {
        return new List<string>
        {
            NotificationName.BAG_UPDATE,
            NotificationName.ITEM_USE_RESULT
        };
    }
    
    // 处理通知
    public override void HandleNotification(INotification notification)
    {
        switch (notification.Name)
        {
            case NotificationName.BAG_UPDATE:
                UpdateBagView();
                break;
            case NotificationName.ITEM_USE_RESULT:
                ShowUseResult(notification.Body as string);
                break;
        }
    }
    
    // 视图更新逻辑
    private void UpdateBagView()
    {
        var bagProxy = Facade.RetrieveProxy(BagProxy.NAME) as BagProxy;
        bagPanel.RefreshItems(bagProxy.Items);
    }
    
    // UI事件响应
    private void HandleItemClick(Item item)
    {
        // Mediator不处理业务逻辑,发个通知交给Command
        SendNotification(NotificationName.USE_ITEM, item.Id);
    }
    
    // Mediator销毁时的清理
    public override void OnRemove()
    {
        bagPanel.OnItemClick -= HandleItemClick;
        base.OnRemove();
    }
}

关键理解

  • Mediator 既不持有数据(数据在Proxy),也不处理业务逻辑(逻辑在Command)
  • Mediator只做两件事:监听UI事件→发Notification出去 + 收到Notification→更新UI

4. Command —— 业务逻辑命令

角色定位:执行具体的业务操作,可以调用多个Proxy协同工作。

csharp

// 简单命令:使用物品
public class UseItemCommand : SimpleCommand
{
    public override void Execute(INotification notification)
    {
        int itemId = (int)notification.Body;
        
        var bagProxy = Facade.RetrieveProxy(BagProxy.NAME) as BagProxy;
        var roleProxy = Facade.RetrieveProxy(RoleProxy.NAME) as RoleProxy;
        
        if (bagProxy.HasItem(itemId))
        {
            bagProxy.RemoveItem(itemId);
            roleProxy.AddHp(100);
            
            // 发通知让UI刷新
            SendNotification(NotificationName.ROLE_HP_UPDATE);
            SendNotification(NotificationName.USE_ITEM_SUCCESS, itemId);
        }
        else
        {
            SendNotification(NotificationName.USE_ITEM_FAIL, "物品不存在");
        }
    }
}

// 宏命令:执行一系列命令(比如登录流程)
public class LoginMacroCommand : MacroCommand
{
    public override void InitializeMacroCommand()
    {
        AddSubCommand(() => new CheckVersionCommand());    // 1. 检查版本
        AddSubCommand(() => new ConnectServerCommand());   // 2. 连接服务器
        AddSubCommand(() => new AuthCommand());            // 3. 身份验证
        AddSubCommand(() => new LoadRoleDataCommand());    // 4. 加载角色数据
        AddSubCommand(() => new EnterGameCommand());       // 5. 进入游戏
    }
}

Command的特点

  • 无状态:每次执行都创建新实例(由框架管理)
  • 单一职责:一个Command只做一件事
  • 可组合:MacroCommand可以把多个SimpleCommand串起来

5. Notification —— 通信的载体

角色定位:模块间传递消息的信封。

csharp

// 定义通知名称常量(避免字符串硬编码)
public static class NotificationName
{
    public const string LOGIN = "login";
    public const string LOGOUT = "logout";
    public const string BAG_UPDATE = "bag_update";
    public const string USE_ITEM = "use_item";
    public const string USE_ITEM_SUCCESS = "use_item_success";
}

// 发送通知的三种重载
SendNotification(NotificationName.LOGIN);                        // 只有名称
SendNotification(NotificationName.LOGIN, loginData);             // 带body(数据)
SendNotification(NotificationName.LOGIN, loginData, "extra");    // 带body和type

Notification与C#事件的对比

特性 C#事件 PureMVC Notification
解耦程度 中等(需要持有发布者引用) 高(完全不知道谁在收)
调试难度 容易跟踪 难(字符串匹配)
性能 快(直接委托调用) 稍慢(反射+装箱拆箱)
跨模块通信 需要统一的事件总线 天然支持

四、完整流程示例:登录功能

把上面所有组件串起来,看一个完整的登录流程:

csharp

// 1. 启动框架(GameManager中)
GameFacade.Instance.Startup();

// 2. UI按钮点击 -> 打开登录面板时注册Mediator
LoginPanel panel = UIManager.Open<LoginPanel>();
GameFacade.Instance.RegisterMediator(new LoginMediator(panel));

// 3. 用户点击登录按钮 -> Mediator监听到UI事件
public class LoginMediator : Mediator
{
    private LoginPanel panel;
    
    public LoginMediator(LoginPanel panel) : base("LoginMediator")
    {
        this.panel = panel;
        panel.OnLoginClick += (user, pwd) => 
            SendNotification(NotificationName.LOGIN, new LoginData(user, pwd));
    }
}

// 4. Command处理登录业务
public class LoginCommand : SimpleCommand
{
    public override void Execute(INotification notification)
    {
        var loginData = notification.Body as LoginData;
        var userProxy = Facade.RetrieveProxy(UserProxy.NAME) as UserProxy;
        
        // 调用网络层发送登录请求
        NetworkManager.Instance.Login(loginData.User, loginData.Pwd, (success, msg) =>
        {
            if (success)
            {
                userProxy.SetUserInfo(msg);
                SendNotification(NotificationName.LOGIN_SUCCESS);
                SendNotification(NotificationName.OPEN_MAIN_PANEL);
            }
            else
            {
                SendNotification(NotificationName.LOGIN_FAIL, msg);
            }
        });
    }
}

// 5. 登录成功 -> 关闭登录界面,打开主界面
public class LoginSuccessCommand : SimpleCommand
{
    public override void Execute(INotification notification)
    {
        // 移除登录Mediator
        Facade.RemoveMediator("LoginMediator");
        // 打开主界面并注册其Mediator
        MainPanel mainPanel = UIManager.Open<MainPanel>();
        Facade.RegisterMediator(new MainMediator(mainPanel));
    }
}

五、PureMVC在Unity中的注意事项

1. MonoBehaviour与PureMVC的关系

原则:Mediator持有MonoBehaviour的引用,但Mediator本身不继承MonoBehaviour。

csharp

// 错误:让Mediator继承MonoBehaviour
public class BadMediator : MonoBehaviour, IMediator { } // ❌

// 正确:Mediator是纯C#类
public class GoodMediator : Mediator  // 不继承MonoBehaviour ✓
{
    private GoodPanel panel; // 持有MonoBehaviour引用
}

2. 生命周期管理

组件 创建时机 销毁时机
Facade 游戏启动时 游戏结束时
Proxy 游戏启动时注册 游戏结束时
Command 每次执行时new 执行完后销毁
Mediator 打开UI时注册 关闭UI时移除

3. 性能优化建议

  • 避免频繁发Notification:一帧内多次发同一个通知可以合并
  • Mediator的ListNotificationInterests返回缓存列表,不要每次new
  • Command尽量轻量:耗时操作要用协程或异步

六、PureMVC的优缺点总结

优点

  1. 约定大于配置:规定好了代码该放哪,团队协作不吵架
  2. 完全解耦:改一个模块基本不影响其他模块
  3. 可测试性强:Proxy和Command可以脱离Unity写单元测试
  4. 学习成本低:核心概念就5个,一两天就能上手

缺点

  1. 代码冗余:一个小功能也要建Mediator+Command+Proxy三个类
  2. Notification难追踪:字符串事件名,谁发谁收不直观
  3. 反射开销:框架内部大量使用反射,但影响不大
  4. 不够Unity原生:不支持MonoBehaviour的生命周期方法

浙江嘉兴港首次实现重大件设备直通欧洲

2026年4月4日 15:55
两批总重超600吨的超大尺寸风电基座在浙江嘉兴港搭乘“新海通502”轮前往荷兰鹿特丹港,用于当地海上风电项目建设。这是嘉兴港首次实现重大件设备直通欧洲,进一步完善了长三角地区绿色能源装备“出海”物流网络。此次风电装备顺利直通欧洲,既是港口服务能级跃升的体现,也为浙江乃至长三角新能源装备参与国际绿色能源建设提供了有力支撑。(新华社)
❌
❌